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这 本 经 典 教材 的 第 5 版 对 计算 机 组 成 结构 进行 了 全 面 的 概括 。 它 介绍 了 硬件 设计 的 原理 ， 
并 且说 明了 硬件 设计 是 如 何 受 软件 需求 影响 的 。 本 书 素材 经 过 反复 改写 ， 反 映 了 计算 机 技术 
发 展 的 现状 。 例 如 使 用 了 典型 的 商用 处 理 器 来 说 明 一 般 的 概念 ， 并 用 ARM、68000 以 及 Pentium 
处 理 器 作为 主要 的 结构 范例 。 书 中 还 包括 了 有 关 散 入 式 系统 的 讨论 。 本 书 涉及 现代 计算 机 设 
计 的 各 个 方面 一 一 处 理 器 、 输 入 / 输出、 存储 器 、 外 围 设备 以 及 通信 链接 ， 重 点 放 在 完整 的 
计算 机 系统 设计 上 。 


本 书 结构 清晰 ， 使 用 灵活 ， 主 要 面向 已 经 学 习 了 逻辑 电路 课程 的 学 生 ， 书 后 附 有 逻辑 电 
路 的 内 容 介绍 ， 没 有 这 方面 基础 知识 的 学 生 也 可 使 用 。 





加 拿 大 滑铁卢 大 学 工程 物理 学 士 ， 加 拿 大 女皇 大 学 电子 工程 硕 
Carl Hamacher 士 ， 美国 Syracuse 大 学 电子 工程 博士 。 自 1991 年 起 任 女皇 大 


学 电子 及 计算 机 工程 学 院 教授 。 他 的 研究 方向 为 多 处 理 器 与 多 计算 机 ， 侧 重 于 网 络 互 连 。 
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。 。 先后 获得 加 拿 大 多 伦 多 大 学 电子 工程 学 士 、 硕 士 及 博士 学 
Zvonko Vranesic 位 ， 他 现在 的 研究 方向 包括 :计算 机 体系 结构 ， 可 编程 


VLSI 技术 及 多 值 逻辑 系统 。 
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本 书 是 计算 机 组 成 的 人 门 级 教程 ， 全 面 地 介绍 了 计算 机 组 成 结构 、 操 作 、 性 能 的 基本 
概念 ， 还 介绍 了 有 关外 围 设备 、 处 理 器 系列 模型 以 及 嵌入 式 系 统 的 一 些 主要 内 容 。 书 中 知 
识 具 有 很 强 的 实用 性 ， 并 涵盖 了 当今 许多 先进 的 技术 和 设计 思想 。 

本 书 知识 结构 相对 独立 ， 需 要 读者 具备 计算 机 高 级 语言 程序 设计 和 数字 逻辑 电路 的 基 
本 知识 。 本 书 适合 用 作 高 等 院 校 电子 工程 、 计 算 机 工程 和 计算 机 科学 专业 计算 机 组 成 课程 
的 教材 。 


Carl Hamacher, Zvonko Vranesic, Safwat Zaky: Computer Organization, Fifth Edition 
(ISBN 0-07-232086-9). 

Copyright © 2002 by The McGraw-Hill Companies, Inc. 

Original English edition published by The McGraw-Hill Companies, Inc. All rights reserved. 
No part of this publication may be reproduced or distributed in any form or by any means, or stored 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ;也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭 烛 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 人 迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum ，Stroustrup，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 废 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 瞻 力 圳 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” RIAR 
“全 美 经 典 学 习 指 导 系 列 ”"。 为 了 保证 这 三 套 从 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公 司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 ”>， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 丛 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. LT., Stanford, U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信 与 网 络 、 离 散 数 学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语 言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 训 、 有 的 已 被 全 
世界 的 几 王 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 ;北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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计算 机 组 成 原理 是 学 习 计算 机 工程 与 计算 机 科学 专业 知识 的 基础 ， 计 算 机 系统 设计 的 复杂 
性 决定 了 本 书 论述 内 容 的 综合 性 和 广泛 性 。 计 算 机 系统 设计 包含 多 个 领域 知识 的 研究 与 应 用 ， 
而 计算 机 体系 结构 的 建立 包括 设计 算法 的 选择 、 设 计 方案 的 确定 、 系 统 成 本 与 系统 性 能 的 权衡 
以 及 硬件 功能 与 软件 功能 的 权衡 等 方面 ， 需 要 考证 大 量 的 实验 数据 并 积累 实践 经 验 。 学 习 计 算 
机 组 成 原理 就 是 要 学 会 从 多 层面 去 理解 所 要 解决 的 具体 问题 ， 从 表面 的 现象 中 挖掘 出 系统 内 在 
的 、 深 层次 的 联系 ， 从 硬件 和 软件 两 个 角度 探讨 最 佳 的 解决 途径 和 解决 方案 。 

《计算 机 组 成 》(Computer Organization) 是 一 本 经 典 的 电子 工程 与 计算 机 科学 专业 的 本 科教 
科 书 ， 它 的 第 1 版 于 1978 年 问世 ， 之 后 陆续 出 版 了 第 2~5 版 ,我们 本 次 翻译 的 第 5 版 目前 已 成 为 多 
所 世界 知名 大 学 的 本 科教 材 。 本 书 知识 结构 合理 ， 知 识 点 全 面 完 整 ， 基 本 概念 广泛 而 新 颖 。 更 
可 贵 的 是 书 中 以 流行 的 商用 处 理 器 作为 范例 ， 描 述 了 各 种 基本 知识 和 基本 概念 的 应 用 方法 和 应 
用 过 程 ， 使 书 中 知识 具有 很 强 的 实用 性 ， 同 时 还 涵盖 了 当今 许多 先进 的 技术 和 设计 思想 。 

本 书 由 12 章 和 5 个 附录 部 分 组 成 ， 全 面 地 介绍 了 计算 机 组 成 、 计 算 机 操作 、 计 算 机 性 能 的 基 
本 概念 ， 还 介绍 了 外 围 设备 、 处 理 器 系列 模型 以 及 嵌入 式 系统 的 一 些 主要 内 容 。 书 中 知识 独立 ， 
适合 讲授 或 自学 。 附 录 中 的 内 容 是 对 正文 的 补充 ， 将 两 者 结合 起 来 学 习 可 以 收 到 良好 的 效果 。 

本 书 由 张 红 光 组 织 并 翻译 ， 张 健 民 、 李 莹 、 蒋 跃 军 参 与 了 大 量 的 翻译 和 校对 工作 。 参 加 本 
书 翻译 、 校 对 及 整理 工作 的 还 有 张 楠 、 王 华 、 徐 巧 丽 、 房 金 伦 等 。 南 开 大 学 微 电 子 中 心 的 李 福 
才 副 教授 对 本 书 的 翻译 工作 给 予 了 大 量 的 帮助 和 指导 ， 在 此 一 并 表示 感谢 。 

由 于 译 者 水 平 有 限 ， 译 文中 疏 漏 和 错误 在 所 难免 ， 敬 请 读者 批评 指正 。 
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本 书 适用 于 电子 工程 、 计 算 机 工程 和 计算 机 科学 专业 有 关 计 算 机 组 成 方面 的 初级 课程 。 本 
书 的 知识 结构 是 相对 独立 的 ， 假 设 读者 已 有 了 计算 机 高 级 语言 程序 设计 的 基本 知识 。 

许多 学 习 计算 机 组 成 的 学 生 都 已 经 学 习 了 数字 逻辑 电路 这 一 门 引 导 课 程 。 因 此 ， 本 书 的 主 
体内 容 没 有 包含 这 一 部 分 的 知识 。 但 是 我 们 为 有 需要 的 读者 提供 了 逻辑 电路 方面 的 详尽 附录 。 

本 书 融 入 了 作者 在 为 电子 及 计算 机 工程 、 计 算 机 科学 与 工程 专业 的 本 科 生 讲授 计算 机 组 成 原 
理 时 所 积累 的 丰富 经 验 。 在 这 个 领域 我 们 总 是 采用 从 实际 出 发 的 观点 进行 教学 ， 因 此 形成 了 本 书 
在 内 容 上 的 一 个 关键 考虑 ， 即 使 用 从 商用 计算 机 中 提取 的 例子 来 说 明 计 算 机 的 组 成 原理 。 本 书 中 
的 主要 例子 来 源 于 以 下 处 理 器 : ARM, Motorola 680X0. Intel Pentium 及 Sun UltraSPARC. 

读者 必须 清楚 地 认识 到 ， 数 字 系 统 的 设计 并 不 是 应 用 最 佳 设计 算法 的 简单 过 程 。 许 多 设计 
决策 取决 于 大 量 试探 性 的 判断 和 经 验 。 这 包括 在 一 系列 选择 方案 中 进行 成 本 /性 能 、 硬 件 /软件 的 
权衡 。 我 们 的 目标 就 是 把 这 些 思 想 传达 给 读者 。 

我 们 努力 提供 足够 多 的 细节 ， 鼓 励 学 生 在 处 理 那 些 看 上 去 很 明显 的 问题 时 进行 深层 次 的 控 
掘 ， 我 们 相信 最 佳 的 途径 是 使 用 那些 已 被 充分 验证 过 的 真实 例子 。 框 图 是 描述 计算 机 组 成 特征 
的 有 效 方法 ,但 是 它们 容易 使 问题 过 于 简单 化 。 因 此 ， 必 须 使 用 各 种 实现 方案 的 细节 作为 补充 。 

本 书 可 以 作为 工程 学 或 计算 机 科学 专业 一 个 学 期 的 课程 用 书 。 它 对 于 软件 和 硬件 方向 的 学 
生 均 适用 。 尽 管 本 书 侧 重 于 硬件 ， 我 们 仍 阐述 了 大 量 软 件 方面 的 问题 ， 包 括 与 指令 执行 性 能 、 
系统 级 并 行 操作 协调 以 及 实时 应 用 程序 相关 的 编译 器 与 操作 系统 的 基本 知识 。 计 算 机 专业 人 员 
有 必要 了 解 软 件 与 硬件 之 间 的 交互 与 权衡 问题 。 


本 书 的 内 容 


下 面 我 们 按 章节 顺序 来 介绍 一 下 本 书 的 内 容 。 前 8 章 涵盖 了 计算 机 组 成 、 操 作 及 性 能 的 基本 
概念 ， 后 4 章 讨论 了 嵌入 式 系统 、 外 围 设备 、 处 理 器 系列 的 演变 模型 以 及 大 型 计算 机 系统 。 

第 1 章 对 计算 机 硬件 和 软件 给 出 了 总 体 的 描述 ， 并 对 在 后 续 章 节 中 将 会 深入 研究 的 术语 进行 
了 概括 性 介绍 。 该 章 介绍 了 基本 功能 部 件 以 及 将 它们 相互 连接 组 成 一 个 完整 计算 机 系统 的 方法 ， 
还 介绍 了 系统 软件 的 作用 ， 并 讨论 了 性 能 评估 的 基本 内 容 。 还 介绍 了 计算 机 的 发 展 简 史 。 

第 2 章 系统 地 介绍 了 机 器 指令 、 寻 址 技术 和 指令 序列 。 为 了 便于 讨论 有 效 地 址 的 生成 ,我们 
引入 了 二 进 制 补 码 运算 。 用 于 讨论 循环 、 子 程序 、 简 单 的 输入 输出 编程 、 排 序 和 链表 操作 的 程 
序 示例 均 在 机 器 指令 级 别 上 使 用 通用 的 汇编 语言 表示 。 

第 3 章 以 三 种 商用 处 理 器 -一 -ARM、68000 和 Pentium 为 例 说 明了 第 2 章 中 概念 的 具体 实现 。 其 
中 ARM 处 理 器 诠释 了 RISC 设 计 风 格 ，68000 使 用 了 易于 接受 的 CISC 设 计 ， 而 Pentium 处 理 器 综合 
了 RISC 和 CISC 的 设计 风格 并 成 为 最 成 功 的 商业 设计 。 这 些 内 容 构成 三 个 独立 而 完整 的 部 分 。 每 
个 部 分 都 包含 第 2 章 中 提出 的 所 有 例子 ， 它 们 使 用 指定 的 处 理 器 进行 了 实现 。 学 习 其 中 任何 一 部 
分 都 能 够 满足 继续 学 习 本 书后 面 章 第 的 需要 。 如 果实 验 室 使 用 了 书 中 介绍 的 其 中 一 种 处 理 器 ， 
那么 第 3 章 中 的 相关 部 分 就 可 以 与 第 2 章 同时 讲授 。 





IX 


输入 输出 结构 将 在 第 4 章 中 介绍 。 这 一 章 讲述 了 IO 数据 传输 同步 的 基本 知识 以 及 一 系列 渐 趋 
复杂 的 IO 结构 。 我 们 对 中 断 和 直接 存储 器 访问 方法 进行 了 详细 的 描述 ， 包 括 对 操作 系统 中 软件 
中 断 作 用 的 具体 讨论 。 还 以 PCI、SCSI 以 及 USB 标 准 为 代表 介绍 了 总 线 协 议 与 标准 。 

第 5 章 讨 论 了 半导体 存储 器 ， 包 括 SDRAM、Rambus 和 内存 (flash memory) 的 实现 。 作 为 增 
加 主 存储 器 带宽 的 方法 ， 本 章 还 介绍 了 高 速 缓存 (cache) 和 多 模块 存储 器 系统 。 其 中 对 高 速 组 
存 进 行 了 详细 讨论 ， 包 括 性 能 建 模 。 还 介绍 了 虚拟 存储 器 系统 、 存 储 器 管理 和 快速 地 址 转换 技 
术 ， 并 将 磁盘 和 光盘 作为 存储 器 体系 结构 的 一 部 分 进行 了 讨论 。 

第 6 章 介 绍 了 计算 机 中 的 算术 单元 ， 对 二 进 制 补 码 数 定点 加 、 减 、 乘 、 除 硬件 的 逻辑 设计 操 
作 作 了 描述 。 这 一 章 还 解释 了 超前 进位 加 法 器 和 快速 乘法 器 ， 并 描述 了 Booth 乘 法 器 重 编码 和 进 
位 保留 加 法 技术 。 另 外 本 章 还 介绍 了 IEEE 标 准 中 浮 点 数 的 表示 与 操作 。 

第 7 章 在 寄存 器 传送 层次 上 介绍 了 处 理 器 取 指 与 执行 的 实现 ， 接 下 来 讨论 了 使 用 硬 布线 和 微 
程序 控制 方式 实现 的 处 理 器 。 

第 8 章 详细 介绍 了 流水 线 和 多 功能 单元 在 高 性 能 处 理 器 设计 中 的 使 用 。 这 一 章 还 探讨 了 编译 
器 的 作用 以 及 流水 线 执行 与 指令 集 设计 之 间 的 关系 。 本 章 还 对 超标 量 处 理 器 进行 了 讨论 ， 并 以 
Sun 公司 的 UltraSRARC HI 处 理 器 为 例 阐述 了 相关 概念 。 

今天 越 来 越 多 的 处 理 器 被 用 于 伐 入 式 系统 而 不 是 通用 计算 机 中 。 大 量 低 成 本 的 应 用 都 需要 
将 处 理 MO 和 定时 功能 集成 在 单个 芯片 上 ， 这 一 日 趋 重要 的 问题 将 在 第 9 章 介绍 。 在 第 9 章 中 还 将 
讨论 系统 集成 、 互 连 及 实时 软件 设计 问题 。 

第 10 章 讲述 外 围 设备 和 计算 机 互 连 的 有 关 知 识 ， 介 绍 了 典型 的 输入 /输出 设备 及 支持 计算 机 
图 形 应 用 所 需要 的 硬件 设备 ， 还 讨论 了 DSL 等 一 般 通 信和 链 路 。 

第 11 章 介绍 了 ARM、Motorola 和 Intel 处 理 器 系列 的 演变 过 程 。 这 一 章 强调 的 是 可 获得 更 高 
性 能 要 求 的 设计 改变 ， 还 讨论 了 PowerPC、SPARC、 Alpha 和 Intel IA-64 系 列 。 

第 12 章 将 计算 机 组 成 的 讨论 扩展 到 多 处 理 器 、 并 行 操作 的 大 型 系统 层面 上 。 这 一 童 描述 了 
多 处 理 器 的 互连网 络 ， 还 对 高 速 缓 存 的 一 致 性 控制 、 共 享 存储 器 与 消息 传递 策略 作 了 介绍 。 


第 5 版 的 特点 


本 书 的 第 5 版 对 内 容 和 结构 安排 主要 作 了 以 下 儿 个 方面 的 改动 : 

“第 4 版 中 的 第 2 章 在 第 5 版 中 拆 为 两 章 ， 即 第 2 章 与 第 3 章 。 本 版 中 第 2 章 对 基础 问题 作 了 扩展 
处 理 ， 并 用 一 般 的 指令 进行 解释 ， 还 提供 了 很 多 解决 典型 问题 的 程序 实例 ， 包 括 数 字 的 与 
非 数字 的 。 而 第 3 章 则 使 用 了 ARM、68000 及 Pentium 处 理 器 等 指令 集 来 说 明 如 何以 RISC 和 
CISC 设 计 风 格 实现 指令 集 设计 的 基本 概念 。 

* 对 流水 线 和 多 功能 单元 在 处 理 器 设计 中 作用 的 讨论 进行 了 很 大 程度 的 扩展 ， 把 UltraSPARC 
体系 结构 作为 增强 设计 性 能 的 一 个 特殊 例子 作 了 介绍 。 

“加 入 了 饮 入 式 处 理 器 系统 这 一 新 内 容 ， 并 以 典型 系统 的 通用 设计 作为 详细 讨论 应 用 举例 的 
基础 。 

除了 上 述 的 主要 变化 外 ， 本 版 的 多 个 章节 还 加 入 了 当今 许多 先进 的 技术 和 设计 方法 。 

课程 进度 安排 


本 书 适合 作为 大 学 或 学 院 计算 机 组 成 方面 入 门 课程 的 教材 ， 总 学 时 为 一 学 期 。 





书 中 提供 了 多 于 一 个 学 期 课程 所 要 讲授 的 内 容 ， 其 核心 部 分 是 第 1 章 至 第 8 章 。 如 果 学 生还 
未 学 习 过 逻辑 电路 ， 则 应 在 第 4 章 之 前 学 习 附 录 A 中 的 基本 内 容 。 

第 9 章 至 第 12 章 包含 了 大 量 实用 的 内 容 ， 教 师 可 根据 实际 情况 自主 安排 所 要 讲授 的 内 容 ， 特 
别 是 第 9 章 有 关 代 入 式 系 统 的 讨论 和 第 10 章 关于 大 多 数 个 人 计算 机 中 所 使 用 的 硬件 设备 描述 。 
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第 1 章 


计算 机 的 基本 结构 


本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

“ 计算 机 的 基本 结构 

“机 器 指令 及 其 执行 

“ 用 于 准备 和 执行 程序 的 系统 软件 
* 计算 机 系统 中 的 性 能 问题 

* 计算 机 发 展 史 


本 书 讲述 的 是 计算 机 的 组 成 结构 。 书 中 描述 了 数字 计算 机 中 用 于 存储 和 处 理 信息 的 各 个 部 
件 的 功能 和 设计 ， 还 介绍 了 与 计算 机 相连 的 从 外 部 设备 接收 信息 和 向 外 部 指定 设备 传送 计算 结 
果 的 执行 部 件 。 本 书 的 大 部 分 内 容 是 专门 针对 计算 机 硬件 和 计算 机 体系 结构 的 。 计 算 机 硬件 由 
电子 电路 、 显 示 器 、 磁 性 和 光 存 储 介质 、 电 动机 械 设备 以 及 通信 设施 等 构成 ,计算机 体系 结构 
包含 具体 的 指令 系统 和 用 于 执行 这 些 指令 的 硬件 设备 。 

本 书 还 介绍 了 计算 机 系统 中 有 关 程 序 设计 和 软件 构件 方面 的 许多 知识 。 要 想 对 计算 机 系统 
有 一 个 良好 的 认识 ， 重 要 的 是 对 各 个 计算 机 部 件 设计 中 的 硬件 和 软件 都 要 有 所 认识 。 

本 章 介绍 了 许多 硬件 和 软件 的 概念 ， 给 出 了 一 些 通用 技术 ， 也 对 这 门 学 科 的 基本 内 容 作 了 
概述 。 后 面 的 章节 会 有 更 详细 的 讨论 。 


1.1 计算 机 的 类 型 


首先 对 数字 计算 机 (简称 计算 机 ) 这 一 术语 作 一 个 定义 。 一 般 地 ， 现 代 计 算 机 是 指 一 个 可 
以 接收 数字 输入 信息 ， 根 据 一 连 串 内 部 存储 指令 对 其 进行 处 理 ， 然 后 产生 输出 结果 的 高 速 电子 
计算 机 器 。 其 中 的 指令 序列 称 为 计算 机 程序 ， 而 内 部 存储 称 为 计算 机 存储 器 。 

各 种 类 型 的 计算 机 在 其 大 小 、 成 本 、 计 算 能 力 和 使 用 目的 上 有 着 很 大 的 不 同 。 在 家 庭 、 学 
校 及 办 公 室 中 最 常用 的 计算 机 是 个 人 计算 机 。 它 是 台式 机 中 最 普通 的 一 种 形式 。 台 式 机 中 包括 
处 理 和 存储 单元 、 图 像 显 示 和 音频 输出 单元 ， 还 有 一 个 可 以 便于 放 在 家 庭 书 桌 或 办 公 桌 上 的 键 
盘 。 存 储 介 质 包括 硬盘 、 光 盘 和 软盘 。 轻 便 的 笔记 本 电脑 是 更 精简 的 个 人 计算 机 、 它 将 所 有 部 
件 都 装 进 一 个 如 公文 包 大 小 的 独立 单元 中 。 而 那些 具有 高 级 图 形 输入 /输出 处 理 功 能 的 工作 站 ， 
虽然 与 台式 机 大 小 类 似 ， 但 计算 能 力 却 远 远 超过 个 人 计算 机 。 工 作 站 经 常 在 工程 应 用 中 使 用 ， 
尤其 是 用 在 交互 式 设 计 工作 中 。 
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除了 工作 站 以 外 ， 还 有 许多 大 型 的 、 功 能 强大 的 计算 机 系统 ， 从 低 端的 企业 系统 、 服 务 器 
到 高 端的 大 型 计算 机 。 企 业 系统 ， 或 称 为 主机 ， 通 常用 于 大 公司 中 的 业务 数据 处 理 ， 因 此 需要 
比 工作 站 更 强 的 计算 能 力 和 更 大 的 存储 容量 。 服 务 器 包含 大 容量 的 数据 库存 储 部 件 ， 从 而 能 够 
满足 大 量 的 数据 访问 需要 。 大 多 数 情况 下 ， 服 务 器 广泛 地 用 于 教育 、 商 业 以 及 个 人 用 户 群 之 中 。 
请 求 和 应 答 通常 通过 因特网 的 通信 设施 进行 传送 。 实 际 上 ， 因 特 网 以 及 与 其 相关 的 服务 器 已 经 
成 为 全 球 各 类 信息 的 主要 来 源 。 因 特 网 通信 设施 包含 复杂 的 高 速 光纤 主干 结构 ， 它 与 广播 电缆 
和 电话 线 互 连 ， 从 而 构成 与 学 校 、 商 店 、 家 庭 的 相连 。 | 

大 型 计算 机 用 于 需要 进行 大 规模 数字 计算 的 工作 中 ， 如 天 气 预 报 、 飞 机 设计 及 仿真 系统 。 
在 企业 系统 、 服 务 器 和 巨型 计算 机 中 ， 各 功能 部 件 (包括 多 处 理 器 ) 通常 是 由 许多 独立 的 、 大 
型 的 部 件 构成 。 


1.2 功能 部 件 


计算 机 包括 五 个 功能 相对 独立 的 主要 部 分 : 输入 设备 、 存 储 器 、 算 术 逻 辑 部 件 、 输 出 设备 、 
控制 器 ， 如 图 1-1 所 示 。 输 入 设备 接收 来 自 操作 员 、 电 动机 械 装 置 (如 键盘 )， 或 是 通过 数字 通 
信 线 路 连接 的 其 他 计算 机 上 的 代码 信息 。 所 接收 的 信息 或 存在 计算 机 的 存储 器 中 供 以 后 使 用 ， 
或 立即 传送 到 算术 逻辑 电路 上 执行 所 需要 的 操作 。 这 个 处 理 步 驻 是 由 内 存 中 的 一 个 程序 决定 的 。 
最 后 ， 处 理 的 结果 通过 输出 设备 送 回 到 外 部 设备 中 。 所 有 这 些 动作 都 是 由 控制 器 控制 和 协调 的 。 
图 1-1 并 没有 显示 出 这 些 功能 部 件 之 间 的 连接 。 有 关 这 些 可 以 通过 多 种 途径 实现 的 连接 ， 将 贯穿 
于 全 书 中 进行 讨论 。 前 面 提 到 的 算术 逻辑 电路 与 主 控制 电路 结合 构成 了 处 理 器 ， 输 入 设备 和 输 
出 设备 通常 整体 称 为 输入 输出 设备 (WO)。 

现在 仔细 观察 一 下 计算 机 处 理 信息 的 过 程 。 把 信息 划分 成 指令 和 数据 将 为 讨论 提供 方便 。 
指令 ， 或 称 为 机 器 指令 ， 是 具体 的 命令 ， 它 们 : 

* 控 制 计算 机 与 WO 设备 之 间 的 信息 传送 。 

“具体 指定 要 执行 的 算术 和 逻辑 操作 。 
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图 1-1 计算 机 的 基本 功能 部 


执行 任务 的 指令 序列 称 为 程序 。 程 序 通常 储存 在 内 存 中 。 处 理 器 从 内 存 中 一 个 接 一 个 地 取 
出 构成 程序 的 指令 ， 然 后 完成 所 需要 的 操作 。 除 了 可 能 有 来 自 于 操作 员 或 与 机 器 连接 的 IO 设备 
上 的 外 部 中 断 以 外 ， 计 算 机 完全 由 存储 程序 (stored program) 控制 着 。 

数据 是 指 作为 指令 操作 数 的 数字 和 字符 编码 。 它 也 经 常 指 任意 的 数字 信息 。 基 于 这 个 定义 ， 
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如 果 一 个 完整 的 程序 ( 即 一 个 指令 序列 ) 要 被 其 他 程序 处 理 ， 那 么 这 个 程序 可 以 被 看 作 是 数据 。 
将 高 级 语言 的 源 程 序 编译 成 一 连 串 的 机 器 指令 就 是 这 样 的 一 个 例子 ， 由 机 器 语言 构成 的 程序 称 
为 目标 程序 。 源 程序 是 编译 程序 的 输入 数据 ， 编 译 程序 将 源 程序 翻译 成 机 器 语言 程序 。 

计算 机 处 理 的 信息 必须 按照 适当 的 格式 进行 编码 。 当 今 的 大 多 数 硬件 使 用 的 是 只 有 两 个 稳 态 
的 数字 电路 ， 即 开 和 关 ( 见 附录 A)。 每 个 数字 、 字 符 或 指令 都 被 编码 成 叫做 位 的 二 进 制 数字 串 ， 
它 只 有 0 和 1 两 个 可 取 的 值 .。 数字 通常 用 按 位 二 进 制 记 数 法 表示 , 这 些 将 在 第 2 章 和 第 6 章 中 详细 讨论 。 
有 时 也 使 用 三 进 制 编码 的 十 进 制 数 (BCD )， 其 中 每 一 个 十 进 制 数 都 被 编码 成 四 位 的 二 进 制 数 。 

字母 数字 字符 也 用 二 进 制 码 表示 。 现 已 开发 出 了 多 种 编码 方案 ， 最 常用 的 两 种 是 ASCII 码 
(每 个 字符 用 七 位 二 进 制 码 表示 ) 和 EBCDIC 码 (扩展 的 二 进 制 码 的 十 进 制 数 )， 其 中 每 八 位 二 进 
制 数 表示 一 个 字符 。 有 关 二 进 制 记 数 法 和 编码 方案 的 更 详细 描述 已 在 附录 E 中 给 出 。 


1.2.1 输入 设备 


计算 机 通过 输入 设备 接收 编码 ， 即 读 取 数 据 。 大 家 最 熟悉 的 输入 设备 就 是 键盘 。 当 一 个 键 
被 敲 击 时 ， 相 应 的 字母 或 数字 就 会 自动 被 转换 成 相应 的 二 进 制 双 传送 到 内 存 或 处 理 器 中 。 

还 有 许多 其 他 类 型 的 输入 设备 ， 包 括 操 作 杆 、 跟 踪 球 和 鼠标 。 这 些 设备 经 常 作为 图 形 输入 
装置 与 显示 器 一 起 使 用 。 话 简 可 以 用 来 捕获 声音 输入 ， 然 后 取样 并 转换 为 数字 编码 进行 存储 和 
处 理 。 第 10 章 将 对 输入 设备 及 其 操作 作 详 细 讨论 。 


1.2.2 存储 器 


存储 器 的 功能 是 储存 程序 和 数据 。 它 分 为 主 存储 器 和 辅助 存储 器 两 种 。 

主 存储 器 是 以 电子 速度 运行 的 高 速 内 存 。 程 序 正 在 被 执行 时 必须 要 储存 在 内 存 中 。 内 存 包 
括 大 量 的 半导体 存储 单元 ， 每 一 个 能 够 存储 一 位 二 进 制 信息 。 这 些 单元 很 少 被 单独 读 取 或 编写 ， 
而 是 按 固 定 大 小 的 组 进行 处 理 ， 这 个 组 称 为 字 。 内 存 规定 包含 有 nn 位 的 字 的 内 容 可 以 通过 基本 
操作 进行 存储 或 检索 。 

为 了 在 内 存 中 能 很 容易 找到 任何 一 个 字 ， 每 个 字 的 单元 都 与 一 个 不 同 的 地 址 相关 联 。 地 址 
、 是 用 来 识别 逐个 单元 的 数字 。 通 过 指明 一 个 特定 的 字 地 址 ， 然 后 给 出 一 条 开始 进行 存储 或 检索 
过 程 的 控制 命令 ， 就 能 够 对 字 进 行 访问 了 。 

每 个 字 的 位 数 通常 称 作为 计算 机 的 字 长 。 典 型 的 字 长 范围 是 从 16 位 到 64 位 。 内 存 的 容量 是 
衡量 一 台 计算 机 规模 的 因素 之 一 。 小 型 的 机 器 通常 只 有 几 千 万 字 的 容量 ， 而 中 等 或 大 型 机 一 一 般 
有 几 千 万 或 几 亿 字 的 容量 。 数 据 通常 按 单个 字 、 多 个 字 或 字 的 部 分 单位 进行 处 理 。 每 访问 一 次 
内 存 ， 通 常 只 有 一 个 字 的 数据 被 读 或 被 写 。 

在 执行 的 过 程 中 ， 程 序 必须 保存 在 内 存 中 。 指 令 和 数据 既 可 以 写 入 内 存 也 可 以 在 处 理 器 的 
控制 下 读 出 。 在 内 存 中 能 够 尽快 地 访问 到 任意 字 的 位 置 是 非常 重要 的 。 任 何 单元 在 指明 了 其 地 
址 后 就 能 在 很 短 而 且 是 固定 长 度 的 时 间 内 访问 到 的 存储 器 ， 叫 做 随机 访问 存储 器 (RAM), i 
间 一 个 字 所 需 的 时 间 叫 做 存储 器 访问 时 间 。 这 个 时 间 是 固定 的 ， 与 所 访问 的 字 的 位 置 无 关 。 当 
今 RAM 设 备 的 访问 时 间 通 常 在 几 纳 秒 〈ns) 至 100 纳 秒 之 间 。 一 台 计 算 机 的 存储 器 可 按照 存储 器 
层次 结构 ， 将 半导体 RAM 设 备 根据 不 同 的 速度 和 大 小 分 为 3 或 4 档 。 小 而 快 的 RAM 设 备 称 为 高 速 
组 并 。 它 们 紧 挨 着 处 理 器 并 且 通 常 由 则 一 个 集成 电路 芯片 控制 以 达到 高 性 能 ， 最 大 的 但 最 慢 的 
设备 是 主 存储 器 。 稍 后 ， 在 本 章 中 我 们 将 给 出 关于 在 存储 器 分 层 体系 结构 中 信息 访问 的 简要 描 





述 。 第 5 章 将 对 计算 机 内 存 的 操作 及 性 能 方面 进行 详细 讨论 。 

虽然 主 存储 器 是 必须 的 ， 但 它 的 价格 也 是 昂贵 的 。 因 此 在 需要 存储 大 量 数据 和 程序 时 ， 尤 
其 是 那些 不 经 常 访 问 的 信息 时 就 会 使 用 附加 并 且 比 较 便 宜 的 辅助 存储 器 。 辅 助 存储 器 有 很 大 的 
ARTH, BHAR, APM (CD-ROM) 等 。 这 些 设备 也 在 第 5 章 中 做 介绍 。 


1.2.3 运算 器 


大 多 数 计算 机 的 操作 是 由 处 理 器 的 算术 还 辑 部 件 《(ALU) 执行 的 。 考 处 一 个 典型 的 例子 : 
假设 将 内 存 中 放置 的 两 个 数字 求 和 。 它 们 被 送 入 处 理 器 中 、 然 后 由 ALU 执 行 实际 的 加 法 操作 。 
所 求 得 的 和 可 能 储存 在 内 存 或 保留 在 处 理 器 中 以 便 直接 使 用 。 

其 他 任意 的 算术 或 逻辑 运算 ， 例 如 乘 、 除 ， 或 比较 数 的 大 小 ， 开 始 都 是 将 操作 数 送 至 由 
ALU 执 行 运算 的 处 理 器 中 。 当 操作 数 被 送 和 处理 器 时 ， 它 们 储存 在 高 速 的 存储 单元 寄存 器 中 。 
每 个 寄存 器 可 以 储存 一 个 字 的 数据 。 在 存储 器 层次 结构 中 ， 寄 存 器 的 访问 时 间 比 最 快 的 高 速 组 
存 的 访问 时 间 稍 微 快 一 点 。 

控制 器 和 运算 器 比 计算 机 系统 连接 的 其 他 设备 的 运行 速度 要 快 许多 倍 。 这 就 使 得 单独 一 个 
处 理 器 能 够 控制 许多 的 外 部 设备 ， 如 键盘 、 显 示 器 ， 磁 盘 和 光盘 、 传 感 器 及 机 械 控制 器 等 。 


1.2.4 输出 设备 


输出 设备 是 输入 设备 的 对 应 设备 。 它 的 功能 是 向 外 界 输出 处 理 结果 。 这 类 设备 中 最 常见 的 
是 打印 机 。 打 印 机 使 用 机 械 冲 击 头 、 喷 墨 流 或 是 激光 打印 机 中 的 复印 技术 完成 打印 过 程 。 现 在 
可 以 生产 出 每 分 钟 打印 10 000 行 的 打印 机 。 这 对 机 械 设备 来 说 是 一 个 非常 高 的 速度 ， 但 和 处 理 器 
的 电子 速度 相 比 仍然 是 很 慢 的 。 

一 些 设备 ， 比 如 图 形 显示 器 ， 既 有 输出 功能 又 有 输入 功能 。 这 也 是 很 多 情况 下 对 具有 这 种 
双重 作用 的 设备 使 用 单一 名 称 “1/O 设 备 ”的 原因 .。 


1.2.5 控制 器 


存储 器 、 运 算 器 和 输入 输出 设备 对 信息 进行 存储 和 处 理 ， 然 后 执行 输入 和 输出 操作 。 这 些 
设备 的 操作 必须 按 一 定 的 方式 互相 协调 。 这 就 是 控制 器 的 工作 。 控 制 器 是 高 效 的 中 枢 系 统 ， 它 
将 控制 信号 传送 到 其 他 设备 并 检测 它们 的 状态 。 

由 输入 和 输出 操作 构成 的 MO 传 输 是 被 O 程 序 的 指令 所 控制 的 ，MO 程 序 识别 相关 的 设备 和 
需要 传输 的 信息 。 但 是 ， 控 制 传输 的 实际 时 序 信号 是 由 控制 电路 产生 的 。 时 序 信号 是 决定 何 时 
发 生 规定 动作 的 信号 。 处 理 器 和 存储 器 之 间 的 数据 传送 也 是 由 控制 器 通过 时 序 信 号 控制 的 。 于 
是 有 理由 将 控制 器 看 作为 一 个 非常 明确 而 且 物 理 上 完全 独立 的 设备 ， 它 和 机 器 的 其 他 部 分 有 相 
互 作用 。 但 在 实际 中 情况 却 恰 恰 相 反 。 很 多 控制 电路 分 布 于 整个 机 器 中 。 大 量 的 控制 线 (MA) 
传递 着 所 有 部 件 中 事件 的 时 序 和 同步 信号 。 

一 台 计 算 机 的 操作 可 以 归纳 如 下 : 

“ 计算 机 通过 输入 设备 以 程序 和 数据 的 形式 接收 信息 ， 然 后 将 其 储存 在 存储 器 中 。 

* 在 程序 的 控制 下 ， 存 储 器 中 的 信息 被 取出 ， 然 后 送 入 运算 器 中 进行 处 理 。 

“经 过 处 理 的 信息 由 输出 设备 送出 计算 机 。 

“机 器 内 部 的 所 有 活动 都 由 控制 器 控制 。 
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在 1.2 节 中 ， 我 们 介绍 了 计算 机 的 活动 是 由 指令 控制 的 。 为 了 执行 一 个 给 定 的 任务 ， 要 在 存 
储 器 中 储存 一 个 包含 一 连 串 指令 的 相应 程序 。 完 成 特定 操作 的 指令 从 存储 器 中 逐个 取出 ， 然 后 
送 入 处 理 器 ， 用 作 操 作 数 的 数据 也 储存 在 存储 器 中 。 一 个 典型 的 指令 如 下 : 
Add LOCA, RO 


“这 条 指令 将 存储 器 中 位 置 为 LOCA 的 操作 数 加 到 处 理 器 中 一 个 寄存 器 R0 的 操作 数 上 ， 然 后 把 所 
求 的 和 放 人 寄存 器 R0 中 。 原 来 LOCA 位 置 中 的 内 容 被 保护 起 来 ， 而 原来 RO 上 的 值 被 覆盖 了 。 这 
条 指令 需要 执行 若干 步 。 首 先 ， 指 令 从 存储 器 中 取出 并 被 送 人 处 理 器 中 ， 然 后 ， 取 出 在 LOCA 处 
的 操作 数 加 到 R0 的 操作 数 上 。 最 后 ， 所 加 的 结果 储存 到 寄存 器 RO 中 。 f 
前 面 的 加 法 指令 将 存储 器 存 取 操 作 与 ALU 操 作 结合 在 一 起 。 在 许多 现代 计算 机 中 ， 由 于 性 

能 的 原因 ， 这 两 种 类 型 的 操作 被 不 同 的 指令 执行 ， 这 个 问题 将 在 第 8 童 中 讨论 。 上 述 指令 的 效果 
可 以 由 下 面 两 条 连续 指令 序列 实现 : 

Load LOCA, RI 

Add RI, RO 


第 一 条 指令 将 存储 器 中 单元 为 LOCA 的 内 容 传 送 到 处 理 器 寄存 器 RI 中 ， 第 二 条 指令 将 寄存 器 RI 和 
RO 中 的 内 容 相 加 然后 将 和 送 入 R0。 注 意 ， 这 样 同时 破坏 了 寄存 器 RI 和 R0 中 的 原始 值 ， 但 存储 器 
中 单元 为 LOCA 的 原始 内 容 被 保存 了 下 来 。 

存储 器 和 处 理 器 之 间 的 传送 从 发 送 存储 单元 地 址 访问 存储 器 并 产生 适当 的 控制 信号 开始 ， 
然后 将 数据 送 入 或 送出 存储 器 。 

图 !-2 显 示 了 存储 器 和 处 理 器 是 如 何 连接 在 一 起 的 ， 也 显示 了 一 些 还 没有 讨论 过 的 处 理 器 的 
重要 操作 细节 。 这 些 部 件 的 互 连 模式 并 没有 明确 表示 出 来 ， 因 为 到 此 为 止 我 们 只 讨论 了 它们 的 
功能 特性 。 第 7 章 将 互相 连接 作为 处 理 器 设计 的 一 部 分 进行 了 详细 描述 。 


一 一 处 理 器 








图 1-2 处 理 器 和 存储 器 之 间 的 连接 
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除 ALU 和 控制 电路 外 ， 处 理 器 中 包含 许多 用 于 不 同 目的 的 寄存 器 。 指 令 寄存 器 ( 琅 ) 保留 
当前 正在 执行 的 指令 。 它 的 输出 结果 由 控制 电路 来 获得 ， 可 产生 能 够 控制 执行 指令 中 不 同 处 理 
部 件 的 时 序 信号 。 程 序 计数 器 (PC) 是 另 一 个 有 专门 用 途 的 寄存 器 。 它 跟踪 程序 执行 的 过 程 ， 
其 中 包含 下 一 条 即将 被 读 取 和 执行 指令 的 内 存 地 址 。 在 一 条 指令 执行 的 过 程 中 ，PC 中 的 内 容 相 
应 地 被 下 一 条 将 被 执行 指令 的 地 址 更 新 。 习 惯 上 说 PC 指向 下 一 条 将 从 内 存 中 取出 的 指令 。 除 了 
了 和 PC， 图 1-2 给 出 了 "个 从 Re 到 R。 ,的 通用 寄 丰 器。 它们 的 作用 将 在 第 2 章 中 解释 。 

还 有 两 种 寄存 器 与 内 存 通信 。 这 就 是 内 存 地 址 寄存 器 (MAR) 和 内 看 数 据 寄 站 器 (MDR). 
MAR 保 存 着 即将 访问 单元 的 地 址 。MDR 保 存 着 将 写 人 该 地 址 单元 或 从 该 地 址 单元 中 读 出 的 数据 。 

现在 来 看 一 下 典型 的 操作 步 又 。 程 序 保存 在 内 存 中 ， 而 且 通 常 是 通过 输入 设备 进行 输入 的 。 
当 PC 指 向 程序 开始 的 第 一 条 指令 时 ， 程 序 开 始 执 行 。PC 中 的 内 容 传 送 到 MAR 中 ， 然 后 将 一 条 读 
取 控制 信息 送 到 存储 器 中 。 经 历 了 访问 内 存 所 需 的 时 间 后 ， 该 地 址 字 (这 里 指 程序 的 第 一 条 指 
令 ) 从 内 存 中 读 出 并 放 进 MDR 中 。 接 下 来 ，MDR 中 的 内 容 传送 给 限 。 此 时 ， 指 令 已 经 准备 好 可 
以 进行 译 码 并 执行 了 。 

如 果 指 令 是 一 个 有 关 ALU 执 行 的 操作 ， 那 么 它 就 需要 获取 所 需要 的 操作 数 。 如 果 操 作 数 保 
存在 内 存 中 ( 它 也 可 以 保存 在 处 理 器 的 一 个 通用 寄存 器 中 )， 就 必须 通过 将 它 的 地 址 传送 给 
MAR 来 获取 ， 并 且 开 始 一 个 Read 周 期 。 当 这 个 操作 数 已 经 从 内 存 中 读 出 并 送 至 MDR 时 ， 它 会 
MDR 传 送 到 ALU 中 。 当 一 个 或 是 多 个 操作 数 按照 这 种 方式 取出 后 ，ALU 就 可 以 执行 所 需要 的 操 
作 了 。 如 果 这 个 操作 结果 将 储存 在 内 存 中 ， 那 么 该 结果 会 送 到 MDR 中 。 操 作 结 果 存 储 单元 的 地 
址 将 送 往 MAR 中 ， 并 且 开始 一 个 Write 周期 。 在 当前 指令 执行 过 程 中 的 某 个 点 上 ，PC 中 的 内 容 递 
增 ， 以 便 使 PC 指向 下 一 条 要 执行 的 指令 。 这 样 ， 一 旦 当前 的 指令 执行 完毕 ， 新 指令 的 读 取 就 开 
始 了 。 | 

除了 在 存储 器 和 处 理 器 之 间 传送 数据 外 ， 计 算 机 还 从 输入 设备 接收 数据 以 及 向 输出 设备 输 
出 数据 ， 从 而 出 现 了 一 些 具 有 处 理 MO 传 送 功能 的 机 器 指令 。 

当 一 些 设备 需要 紧急 服务 时 ， 程 序 的 正常 执行 可 能 会 被 中 断 。 例 如 ， 在 一 个 计算 机 控制 的 
工业 流程 中 ， 监 视 器 可 能 观察 到 了 一 个 危险 的 情况 。 为 了 立即 处 理 这 一 情况 ， 必 须 中 断 当 前 程 ` 
序 的 执行 。 为 此 ， 设 备 发 出 一 个 中 断 信号 。 所 谓 中 断 是 来 自 HO 设 备 的 需要 处 理 器 提供 服务 的 请 
求 。 处 理 器 提供 请 求 所 需要 的 中 断 服 务 程序 (interrupt-service routine )。 因 为 这 样 的 转变 可 能 会 
改变 处 理 器 内 部 的 状态 ， 所 以 必须 在 中 断 之 前 保存 状态 在 存储 单元 中 。 通 常 ，PC 中 的 内 容 、 通 
用 寄存 器 和 一 些 控制 信息 都 储存 在 内 存 中 。 当 中 断 服 务 程序 完成 时 ， 处 理 器 的 状态 就 被 恢复 ， 
从 而 使 得 被 中 断 的 程序 可 以 继续 执行 。 

图 1-2 中 所 示 的 处 理 器 单元 通常 在 一 块 超大 规模 集成 电路 (VLSI) 汞 片上 实现 ， 在 同一 块 艺 
片上 至 少 包含 有 存储 器 层次 结构 中 的 高 速 缓存 部 件 。 


1.4 总 线 结构 


前 面 ， 我 们 已 经 介绍 了 计算 机 中 各 个 部 件 的 功能 。 为 了 构成 一 个 可 操作 的 系统 ， 这 些 部 件 
必须 有 组 织 地 以 某 种 方式 连接 起 来 。 可 以 有 多 种 方法 实现 这 一 点 。 在 这 里 只 考虑 最 简单 而 且 最 
常用 的 方法 。 

为 了 达到 一 个 合适 的 操作 速度 、 计 算 机 必须 是 有 组 织 的 ， 这 样 才能 使 所 有 单元 在 规定 的 时 
闻 内 处 理 一 个 完整 的 数据 字 。 当 数据 中 的 一 个 字 在 单元 中 传递 时 ， 它 的 所 有 位 都 在 并 行 传递 ， 





AU 2 £ Pt 40 7 


即 这 些 位 同时 在 许多 线路 上 传递 ， 一 位 一 条 线 。 一 组 作为 连接 通道 为 多 个 设备 服务 的 线路 称 为 
总 线 。 除 了 传递 数据 的 线路 外 ， 总 线 中 还 必须 包括 地 址 线 和 控制 线 。 

各 功能 部 件 互 连 的 最 简单 方法 是 使 用 单 总 线 ， 如 图 1-3 所 示 。 所 有 的 设备 都 和 该 总 线 相连 。 
因为 总 线 一 次 只 能 进行 一 种 传递 ， 所 以 只 有 两 个 设备 可 以 在 任何 给 定 的 时 间 内 自由 使 用 总 线 。 
总 线 的 控制 线 是 用 来 仲裁 总 线 的 多 重 使 用 需求 的 。 单 总 线 的 主要 优点 是 它 的 低 功 耗 和 连接 外 转 
设备 的 灵活 性 。 包 含 多 个 总 线 的 系统 由 于 允许 两 个 或 更 多 的 传递 同时 进行 ， 因 而 在 操作 中 具有 
更 强 的 并 行 性 。 这 样 做 获得 了 更 好 的 性 能 ， 但 却 增 加 了 功 耗 。 


4 
| 输入 | | 输出 | | 存储 器 | 处理 器 
| i : 


图 1-3 单 总 线 结构 - 

连接 在 总 线 上 的 设备 运行 速度 差别 很 大 。 一 些 电 动机 械 设备 ， 如 键盘 和 打印 机 ， 速 度 相对 来 
说 比较 慢 。 其 他 如 光盘 和 磁盘 ， 速 度 就 相对 很 快 。 存 储 器 和 处 理 器 以 电子 速度 运行 ， 它 们 是 计算 
机 中 最 快 的 部 件 。 因 为 所 有 这 些 设备 都 要 通过 总 线 和 其 他 的 设备 联系 ， 所 以 需要 一 个 高 效 的 传输 
机 制 ， 它 不 能 被 低速 设备 约束 同时 又 能 够 调节 处 理 器 、 内 存 和 外 部 设备 之 间 节 奏 上 的 差异 。 

一 个 常用 的 方法 是 设备 带 有 缓冲 寄存 器 ,在 传输 过 程 中 保存 信息 。 为 了 举例 说 明 这 一 技术 ， 
现在 考虑 一 个 字符 编码 从 处 理 器 到 字符 打印 机 的 传输 过 程 。 处 理 器 将 字符 通过 总 线 传送 到 打印 
机 的 缓冲 器 中 。 因 为 缓 促 器 是 一 个 电子 寄存 器 ， 所 以 这 个 传送 过 程 只 需要 相对 短 的 时 间 。 一 
缓冲 器 被 装 满 , 打印 机 就 开始 打印 而 不 需要 处 理 器 的 进一步 干涉 。 此 时 不 再 需要 总 线 和 处 理 器 ， 
可 以 将 它们 释放 出 来 去 完成 其 他 的 活动 。 打 印 机 继续 打印 在 缓冲 器 中 的 字符 ， 并 且 不 接受 新 来 
的 传输 ， 直 至 这 一 打印 过 程 结 束 。 这 样 ， 缓 冲 寄存 器 就 解决 了 处 理 器 、 内 存 和 1O 设 备 间 的 节 
奏 差 异 。 这 样 做 防止 了 在 一 系列 数据 传输 中 高 速 的 处 理 器 被 锁定 在 低速 的 MO 设备 上 。 这 也 使 
处 理 器 能 够 快速 地 从 一 个 设备 转向 另 一 个 设备 ， 在 需要 多 个 IO 设备 的 数据 传输 中 交替 进行 处 
理 活动 。. 


1.5 软件 


为 了 让 用 户 能 够 输入 并 运行 一 个 应 用 程序 ， 计 算 机 必须 事先 在 其 内 存 中 存 入 一些 系统 软件 。 
系统 软件 是 一 个 程序 的 集合 ， 其 作用 如 下 : 

. 接收 和 解释 用 户 的 命令 。 

“输入 和 编辑 应 用 程序 ， 然后 将 它们 作为 文件 储存 在 畏 助 存储 设备 中 。 

“管理 辅助 存储 设备 中 的 文件 存储 和 检索 。 

“运行 由 用 户 提供 数据 的 标准 应 用 程序 ， 如 字 处 理 器 、 电 子 表格 、 游 戏 等 。 

"控制 VO 设备 ， 接 受 输入 信息 并 产生 输出 结果 。 

"将 用 户 制作 的 源 程序 格式 转换 成 由 机 器 指令 构成 的 目标 程序 格式 。 

"使 用 已 存在 的 标准 库 程序 ， 如 数值 计算 包 ; 链接 和 运行 用 户 编写 的 应 用 程序 。 

系统 软件 就 是 这 样 对 计算 机 系统 中 的 所 有 活动 进行 协调 的 。 本 节 的 目的 是 介绍 系统 软件 的 











一 些 基本 内 容 。 

应 用 程序 通常 使 用 高 级 程序 设计 语言 如 C、C++、Java 或 Fortran 编 写 ， 程 序 员 在 程序 中 指定 
数学 的 或 文本 处 理 的 操作 。 这 些 操作 使 用 一 种 格式 进行 描述 ， 这 种 格式 是 独立 于 指定 运行 该 程 
序 的 计算 机 的 。 使 用 高 级 语言 的 程序 员 不 需要 了 解 机 器 语言 指令 的 细节 。 一 个 叫做 编译 器 的 系 
统 软 件 程序 可 以 将 高 级 语言 程序 转换 成 恰当 的 机 器 语言 程序 ， 这 些 机 器 语言 程序 中 包含 指令 ， 
比如 在 1.3 节 中 讨论 过 的 Add 和 Load 指 令 。 

另 一 个 所 有 程序 员 都 要 使 用 的 重要 系统 程序 是 文本 编辑 器 。 它 用 来 输入 和 编辑 应 用 程序 。 
这 个 程序 与 用 户 交互 地 执行 命令 ， 这 些 命令 允 许 从 键盘 键入 的 源 程 序 语句 存放 在 文件 中 。 文 件 
是 一 系列 储存 在 内 存 或 辅助 存储 器 中 的 简单 字母 、 数 字 、 字 符 或 二 进 制 数据 。 一 个 文件 可 以 通 
过 用 户 选择 的 名 字 进 行 访问 。 

本 书 中 不 讨论 编译 器 、 编 辑 器 或 文件 系统 的 细节 ， 下 面 来 仔细 地 看 一 看 被 称 为 操作 系统 的 
主要 系统 软件 构件 。 这 是 一 个 大 型 程序 ， 实 际 上 是 一 个 程序 的 集合 ， 它 用 来 控制 各 种 计算 机 设 
备 在 执行 应 用 程序 时 的 资源 共享 和 相互 作用 。OS 程 序 按 要 求 执行 为 每 个 独立 的 应 用 程序 分 配 计 
算 机 资源 的 工作 。 这 些 工 作 包 括 为 程序 和 数据 文件 分 配 内 存 和 磁盘 空间 、 在 内 存 和 磁盘 之 间 传 
递 数据 及 处 理 MO 操 作 等。 

为 了 理解 操作 系统 的 基本 概念 ， 现 在 假设 系统 只 有 一 个 处 理 器 、 一 个 磁盘 和 一 台 打 印 机 。 首 
先 我 们 讨论 运行 一 个 应 用 程序 的 步骤 。 一 旦 解释 了 这 些 步 又 ， 读 者 就 会 明白 操作 系统 是 如 何 处 理 
多 个 应 用 程序 同时 执行 的 问题 。 假 设 这 个 应 用 程序 已 经 从 高 级 程序 语言 编译 成 机 器 语言 并 储存 在 
磁盘 中 。 第 一 步 是 将 这 个 文件 传送 到 内 存 中 ， 当 传输 结束 时 ， 程 序 的 执行 就 开始 了 。 假 设 这 个 程 
序 的 一 部 分 工作 是 从 磁盘 中 读 取 一 个 数据 文件 并 送 入 内 存 ， 对 数据 进行 一 些 运算 ， 然 后 打印 出 结 
果 。 当 需要 数据 文件 时 ， 程 序 就 会 请 求 操作 系统 将 磁盘 中 的 数据 文件 传输 到 内 存 中 。OS 完 成 这 
项 工作 并 将 执行 控制 返还 给 应 用 程序 ， 然 后 应 用 程序 继续 进行 所 需要 的 运算 。 当 运算 完成 并 准备 
打印 结果 时 ， 应 用 程序 再 一 次 向 操作 系统 发 出 请 求 ， 于 是 有 一 个 OS 程 序 使 打印 机 打印 出 结果 来 。 

我 们 已 经 看 到 执行 控制 权 是 如 何在 应 用 程序 和 OS 程 序 之 间 来 回 传递 的 。 使 用 一 个 时 间 线路 
图 可 以 方便 地 说 明 处 理 器 执行 时 间 的 共享 问题 ， 如 图 1-4 所 示 。 在 至 4 段 ，OS 程 序 开始 将 应 


打印 机 
磁盘 


OS 程序 


程序 





图 1-4 用 户 程序 和 OS 程序 共享 处 理 器 
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用 程序 从 磁盘 装载 到 内 存 ， 等 待 装载 传输 结束 后 将 执行 控制 权 传送 给 应 用 程序 。 类 似 的 操作 也 
发 生 在 ”至 b E. 35 上段 ， 即 当 操作 系统 从 磁盘 中 传递 数据 文件 时 和 打印 结果 时 。 在 时 刻 ， 
操作 系统 可 能 已 经 在 装载 和 执行 另 一 个 应 用 程序 了 。 

现在 介绍 当 多 个 应 用 程序 需要 处 理 时 能 高 效 使 用 计算 机 资源 的 方法 。 我 们 注意 到 磁盘 和 处 
理 器 在 uE fs 段 的 大 部 分 时 间 内 是 闲置 的 ， 操 作 系 统 可 以 在 打印 机 正在 工作 的 时 刻 就 从 磁盘 中 
将 下 一 个 要 被 执行 的 程序 装 入 到 内 存 中 。 同 样 ， 从 b 至 n 段 ， 操 作 系统 可 以 在 当前 程序 正在 从 
磁盘 装 入 时 安排 打印 前 一 程序 的 结果 。 这 样 ， 操 作 系 统 协 调 多 个 应 用 程序 的 并 行 执行 ， 这 样 可 
以 最 大 限度 地 利用 计算 机 资源 。 这 种 并 行 执 行 的 方式 称 为 多 道 程 序 或 多 任务 。 


1.6 性 能 


衡量 一 台 计算 机 性 能 好 坏 的 最 主要 因素 是 看 它 执行 程序 的 速度 有 多 快 。 一 台 计 算 机 执行 程 
序 的 速度 受到 硬件 及 机 器 语言 指令 设计 的 影响 。 由 于 程序 常常 使 用 高 级 程序 设计 语言 编写 ， 所 
以 性 能 也 会 受到 将 程序 转换 成 机 器 语言 的 编译 器 的 影响 。 为 了 达到 最 佳 性 能 ， 需 要 使 编译 器 、 
机 器 指令 设备 及 硬件 的 设计 协调 一 致 。 本 书 不 描述 纺 译 器 设计 的 细节 ， 只 关注 指令 设备 和 硬件 
的 设计 。 

在 1.5 节 中 ， 我 们 描述 了 操作 系统 是 如 何 进行 重 双 处理、 磁盘 传输 以 及 最 大 限度 使 用 可 用 资 
源 处 理 多 个 程序 打印 等 问题 。 在 图 1-4 中 给 出 的 执行 程序 所 需要 的 总 时 间 为 ~。 这 一 段 实 际 消 
耗 时 间 是 对 整个 计算 机 系统 的 性 能 测量 。 它 受到 处 理 器 、 磁 盘 和 打印 机 速度 的 影响 。 找 述 处 理 
器 的 性 能 ， 应 该 只 需要 考虑 处 理 器 正在 工作 的 时 间 ， 即 在 图 1-4 中 标注 有 程序 及 OS 程序 的 时 间 段 。 
这 些 时 间 段 的 总 和 称 为 程序 执行 所 需 的 处 理 器 时 间 。 接 下 来 了 解 一 些 影响 处 理 时 间 的 主要 参数 ， 
并 指出 讨论 相关 问题 的 章节 ， 和 希望 读者 在 学 习 后 面 内 容 时 能 时 刻 记 起 这 些 关于 性 能 的 描述 。 

就 像 执行 一 个 程序 实际 消耗 的 时 间 依 赖 于 计算 机 系统 中 的 所 有 部 件 一 样 ， 处 理 器 时 间 依赖 
于 执行 每 条 机 器 指令 的 硬件 。 这 些 硬件 包括 处 理 器 和 存储 器 ， 它 们 通常 由 一 条 总 线 连接 起 来 ， 
如 图 1-3 所 示 。 图 中 相关 的 部 分 在 图 1-5 中 再 一 次 表示 出 来 ， 包 含 作为 处 理 器 单元 中 一 部 分 的 高 束 
缓存 (cache)。 现 在 让 我 们 来 看 一 下 程序 指令 和 数据 在 内 存 与 处 理 器 之 闻 的 流动 过 程 。 在 开始 执 
行 时 ， 所 有 程序 指令 和 所 需 数据 都 存储 在 主 在 中 。 随 着 执行 过 程 的 推进 ， 指 令 经 过 总 线 被 逐条 
提取 到 处 理 器 中 ， 并 且 在 高 速 缓存 中 存放 了 一 个 副本 。 当 指令 的 执行 需要 主 存储 器 中 的 数据 时 ， 
数据 被 取出 并 在 高 速 缓存 中 存放 一 个 副本 。 以 后 ， 如 果 需 要 再 一 次 使 用 相同 的 指令 或 数据 时 就 
可 以 直接 从 高 速 缓存 中 读 出 。 








j, 总 线 


OOS 处 理 器 的 高 速 组 丰 
处 理 器 和 相对 小 的 高 速 缓存 可 以 集成 在 一 个 单独 的 集成 电路 芯片 上 。 这 类 芯片 执行 指令 处 
理 基 本 步骤 的 内 部 速度 非常 快 ， 比 从 主 存储 器 中 提取 指令 和 数据 要 快 得 多 。 主 存 和 处 理 器 之 间 
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的 指令 及 数据 的 移动 时 间 越 短 ， 程 序 就 执行 得 越 快 ， 使 用 高 速 缓存 可 达到 这 一 目标 。 例 如 ， 假 
设 许多 指令 在 一 段 很 短 的 时 间 内 重复 执行 ， 比 如 程序 中 的 循环 语句 。 如 果 这 些 指 令 可 在 高 速 组 
存 中 获得 ， 它 们 可 以 在 重复 使 用 时 被 很 快 地 取出 来 。 这 种 方式 同样 适用 于 数据 的 重复 使 用 。 主 
存储 器 和 高 速 缓存 的 设计 、 操 作 和 执行 问题 将 在 第 5 章 中 讨论 。 


1.6.1 处 理 器 时 钟 


处 理 器 电路 由 称 为 时 钟 的 时 序 信 号 控制 。 时 钟 定义 了 规则 的 时 间 间 隔 ， 称 为 时 钟 周期 。 为 
了 执行 一 条 机 器 指令 ， 处 理 器 将 要 被 执行 的 动作 分 解 为 一 系列 基本 步 只 ， 这 样 使 每 个 步 又 都 可 
以 在 一 个 时 钟 周 期 内 完成 。 时 钟 周期 的 长 度 P 是 一 个 影响 处 理 器 性 能 的 重要 参数 。 它 的 倒数 是 时 
钟 频率 R = 1/P， 使 用 R 可 以 度量 每 秒 的 周期 数 。 现 今 的 个 人 计算 机 和 工作 站 中 使 用 的 处 理 器 的 时 
钟 频率 范围 从 每 秒 几 亿 次 到 十 亿 次 以 上 。 在 标准 的 电子 工程 术语 中 ， 将 “每 秒 的 周期 数 ”. 称 为 
AE (Hz). 百 万 ”用 前 绥 M 表 示 ,“ 十 亿 ” 用 前 缘 G 表 示 。 因 此 ， 每 秒 5 亿 个 周期 通常 表示 为 
500 MHz， 每 秒 12.5 亿 个 周期 表示 为 1.25 GHz。 相 应 的 时 钟 周期 分 别 为 2 纳 秒 (ns) 和 0.8 纳 秒 。 


1.6.2 基本 性 能 公式 


下 面 来 关注 处 理 器 总 消耗 时 间 的 构成 。 令 T 为 执行 使 用 高 级 语言 编写 的 程序 所 需要 的 处 理 
器 时 间 。 编 译 器 生成 一 个 与 源 程序 相符 的 机 器 语言 目标 程序 。 假 设 该 程序 的 完整 执行 需要 执行 
N 个 机 器 语言 指令 。 数 字 N 为 实际 指令 执行 数 ， 它 不 必 与 目标 程序 中 的 机 器 指令 数 相 等 。 有 些 指 
令 可 能 不 止 一 次 被 执行 ， 就 像 在 循环 程序 中 指令 的 情况 。 其 他 的 指令 可 能 根本 不 被 执行 ， 这 取 
决 于 使 用 的 输入 数据 。 假 设 执行 一 条 机 器 指令 需要 的 基本 步骤 平均 数 为 9， ENERET 
时 钟 周期 内 完成 。 如 果 时 钟 频率 为 每 秒 R 个 周期 ， 则 程序 执行 的 时 间 为 : 
NxS 


1-1 
T a (1-1) 


这 个 公式 常 被 称 为 基本 性 能 公式 。 

对 于 用 户 来 说 ， 应 用 程序 中 的 性 能 参数 7 比 参数 NM、8 或 R 任 一 个 都 重要 得 多 。 为 了 达到 较 
高 的 性 能 ， 计 算 机 设计 人 员 必 须 找 到 减少 T 值 的 方法 ， 这 意味 着 减少 N 和 5S， 增 加 R。 如 果 源 程 
序 被 编译 成 较 少量 的 机 器 指令 ，N 的 值 就 会 减少 。 如 果 指令 包含 更 少 需 要 执行 的 基本 步 喉 或 者 
指令 的 执行 了 是 重 登 的 ，$ 的 值 就 会 减少 。 使 用 高 频 时 钟 会 增加 R 的 值 ， 这 意味 着 完成 一 个 基本 执 

行 步 又 的 时 间 减 少 了 。 

必须 强调 N、3 和 R 不 是 独立 的 参数 ; 改变 一 个 就 有 可 能 影响 到 其 他 两 个 值 。 在 处 理 器 设计 
中 引入 一 种 新 特征 ， 只 有 在 总 的 结果 是 减少 了 7 值 时 才能 够 实现 性 能 改善 。 一 个 具有 900MHz 时 
钟 的 处 理 器 未 必 比 一 个 700MHz 的 处 理 器 性 能 好 ， 原 因 是 它们 可 能 有 着 不 同 的 S 值 。 


1.6.3 流水 线 和 超标 量 操作 


在 上 面 的 讨论 中 ， 我 们 假设 指令 是 一 个 接 一 个 被 执行 的 。 因 此 ，5 是 执行 一 条 指令 总 的 基 
本 步骤 数 ， 或 时 钟 周期 数 。 使 用 一 种 称 为 流水 线 的 技术 ， 可 以 通过 益 加 连续 指令 执行 的 方法 真 
正 地 改善 性 能 。 考 虑 下 面 的 指令 
Add R1, R2, R3 


该 指令 将 寄存 器 R1 和 R2 的 内 容 相 加 ， 并 将 结果 放 到 R3 中 。R1 和 R2 中 的 内 容 首先 被 传送 到 ALU 





的 输入 中 ， 在 加 法 运算 执行 之 后 ， 其 和 被 送 到 R3 中 。 处 理 器 可 以 在 执行 加 法 操作 时 从 内 存 中 读 
取 下 一 条 指令 。 然 后 ， 如 果 该 指令 仍然 使 用 ALU ， 它 的 操作 数 可 以 在 上 一 条 求 和 指令 的 结果 送 
到 R3 的 同时 传送 至 ALU 的 输入 中 。 理 想 情况 下 ， 如 果 所 有 的 指令 都 最 大 限度 地 被 倒 加 ， 执 行 过 
程 以 每 个 时 钟 周期 完成 一 条 指令 的 速度 进行 。 个 别 的 指令 仍然 需要 几 个 时 钟 周 期 去 完成 。 但 是 
为 了 计算 7 值 ，$ 的 有 效 值 为 1。 

流水 线 技 术 将 在 第 8 章 中 做 详细 讨论 。 正 如 我 们 将 要 看 到 的 ， 由 于 各 种 原因 不 能 够 在 实际 
中 达到 理想 值 S = 1。 但 是 ,流水 线 明 显 地 提高 了 指令 执行 的 速度 ， 并 使 5 的 有 效 值 接近 于 1。 

如 果 在 处 理 器 中 实现 了 多 个 指令 流水 线 就 能 达到 更 高 度 的 并 发 性 。 这 意味 着 使 用 多 功能 部 
件 创造 了 可 以 使 不 同 指令 并 行 执 行 的 平行 路 线 。 在 这 样 的 安排 下 ， 有 可 能 在 每 个 时 钟 周期 中 开 
始 若干 条 指令 的 执行 。 这 种 运算 方式 称 为 超标 量 执行 。 如 果 在 程序 执行 中 能 长 时 间 保 持 这 种 运 
算 方 式 ，$ 的 有 效 值 可 减 小 到 1 以 下 。 当 然 并 行 执行 必须 保证 程序 巡 辑 的 正确 性 ， 也 就 是 说 ， 产 
生 的 结果 必须 与 串 行 执行 程序 指令 的 结果 相同 。 现 今 许多 高 性 能 处 理 器 就 是 基于 这 种 操作 方式 
设计 的 。 

1.6.4 时 钟 频率 


提高 时 钟 频率 R 有 两 种 可 能 的 方法 。 第 一 ， 改 进 集成 电路 (IC) 技术 ， 减 少 完成 一 个 基本 
步 又 所 需要 的 时 间 ， 从 而 使 逻辑 电路 速度 加 快 。 这 样 就 使 时 钟 周期 P 缩 短 ， 时 钟 频率 R 提 高 。 第 
二 ， 减 少 在 基本 步骤 中 的 处 理 量 也 可 以 缩短 时 钟 周 期 P。 但 是 ， 如 果 一 条 指令 要 求 执 行 的 动作 
必须 保持 不 变 ， 所 需 的 基本 步 又 数 可 能 会 增加 。 

R 值 的 提高 完全 取决 于 IC 技 术 的 改进 ， 它 影响 了 处 理 器 操作 的 各 个 方面 ， 而 不 仅仅 是 对 访 
问 主 存 时 间 的 影响 。 当 存在 高 速 缓存 时 ， 访 问 主 存 所 占 的 百分比 很 小 。 因 此 ， 多 数 指令 执行 从 
使 用 可 实现 的 快速 技术 中 获得 了 预期 的 效果 。 当 R 增 加 时 由 于 Ss 和 N 不 受 影响 ，7 值 也 将 会 随 之 
减 小 。 改 变 指令 划分 基本 步 双 的 方法 对 性 能 的 影响 更 加 难以 估计 。 这 个 问题 将 在 第 8 章 中 讨论 。 


1.6.5 指令 集 : CISC 和 RISC ` 


简单 的 指令 需要 执行 少量 的 基本 步 县 。 复 杂 的 指令 则 需要 大 量 的 步骤 。 对 于 一 个 只 有 简单 
指令 的 处 理 器 来 说 ， 一 项 给 定 的 程序 设计 任务 可 能 需要 执行 大 量 的 指令 。 这 可 能 导致 一 个 大 的 
N 值 和 一 个 小 的 S 值 。 另 一 方面 ， 如 果 单 独 的 指令 执行 了 较 多 的 复杂 操作 ， 需 要 的 指令 就 少 ， 这 
又 会 导致 一 个 小 的 N 值 和 一 个 大 的 $ 值 。 哪 种 选择 更 优越 并 不 明显 ，。 

比较 两 种 选择 的 关键 因素 是 流水 线 的 使 用 。 前 面 已 经 指出 流水 线 处 理 器 中 的 有效 值 接近 
于 1， 即 使 每 个 指令 的 基本 步骤 值 可 能 相当 大 。 这 就 预示 着 与 流水 线 结合 的 复杂 指令 可 以 达到 
最 佳 性 能 。 但 是 ， 使 用 简单 指令 集 在 处 理 器 中 实现 高 效 流水 线 更 加 容易 。 在 流水 线 执行 中 选择 
合适 的 指令 集 是 一 个 重要 的 因素 ,而且 常 常 是 决定 性 的 。 

指令 集 的 设计 和 可 用 的 选择 将 在 第 2 章 中 讨论 。 关 于 简单 指令 处 理 器 和 较 复 杂 指 令 处 理 器 
各 自 的 优势 我 们 已 经 了 解 了 很 多 中 。 前 者 被 称 作为 精简 指令 集 计算 机 (RISC)， 后 者 被 称 为 复 
杂 指令 集 计算 机 (CISC)。 在 第 3 章 和 第 11 章 中 给 出 了 RISC 和 CISC 的 例子 ， 并 且 讨 论 了 它们 的 
优势 。 虽 然 为 了 与 当前 的 描述 相 一 致 我 们 使 用 了 术语 RISC 和 CISC， 但 提醒 读者 不 要 认为 它们 
是 清晰 的 计算 机 分 类 。 现 有 的 处 理 器 设计 是 多 方面 权衡 的 结果 。 术 语 RISC 和 CISC 涉 及 到 的 设 
计 原 则 和 技术 会 在 本 书 中 多 次 进行 讨论 。 | 
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1.6.6 编译 器 


编译 器 将 高 级 语言 设计 的 程序 转换 为 一 系列 机 器 指令 。 为 了 减少 N 值 ， 需 要 有 一 个 合适 的 
机 器 指令 集 和 能 很 好 使 用 它 的 编译 器 。 优化 编译 器 利用 各 种 目标 处 理 器 的 特性 来 减少 N x 5 的 值 ， 
这 一 乘积 表示 执行 一 个 程序 所 需 的 时 钟 周期 总 数 。 在 第 8 章 中 将 会 看 到 周期 数 不 仅 仅 取决 于 指 
令 的 选择 ， 还 取决 于 它们 在 程序 中 出 现 的 顺序 。 编 译 器 会 重新 安排 程序 指令 以 获得 更 高 性 能 。 
当然 ， 这 些 变化 不 会 影响 到 计算 结果 。 

表面 上 看 ， 编 译 器 是 一 个 与 处 理 器 独立 使 用 甚至 可 能 从 不 同 的 销售 商 手 中 买 到 的 实体 。 但 
是 ， 一 个 高 质量 的 编译 器 一 定 与 处 理 器 体系 结构 紧密 相关 。 编 译 器 和 处 理 器 常常 同时 设计 ， 并 
通过 设计 者 的 相互 协调 来 达到 最 佳 结 果 。 最 终 的 目的 是 为 了 在 执行 程序 设计 任务 时 ， 所 需 的 时 
钟 周期 总 数 减少 。 


1.6.7 性 能 测量 


对 一 台 计 算 机 性 能 的 评估 是 很 重要 的 。 计 算 机 设计 者 要 使 用 性 能 评估 来 对 新 功能 的 有 效 性 
进行 评价 。 制 造 商 在 营销 过 程 中 要 使 用 性 能 指标 。 购 买 者 要 使 用 这 些 数据 在 众多 的 计算 机 型 号 
中 进行 选择 。 

这 些 讨论 使 人 想到 描述 计算 机 性 能 的 惟一 合适 参数 是 对 程序 的 执行 时 间 T。 尽 管 公式 (1-1) 
中 的 概念 很 简单 ， 计 算 7 的 值 却 不 那么 容易 。 此 外 ， 像 时 钟 速度 和 各 种 体系 结构 特性 这 样 的 参 
数 并 不 能 对 预期 的 性 能 做 出 可 靠 指示 。 | 

基于 这 些 原 因 ， 计 算 机 协会 提出 使 用 基准 程序 来 测量 计算 机 性 能 的 思想 。 为 了 能 够 进行 比 
较 ， 必 须 使 用 标准 化 的 程序 。 这 个 性 能 测量 的 是 计算 机 执行 一 个 规定 的 基准 程序 所 需要 的 时 间 。 
最 初 ， 设 计 者 试图 创造 一 些 假想 的 程序 作为 标准 的 基准 。 但 是 假想 程序 不 能 恰当 地 预测 实际 应 
用 程序 运行 时 所 能 达到 的 性 能 。 

现今 公认 的 方法 是 使 用 一 个 一 致 的 实际 应 用 程序 来 评估 性 能 。 一 个 叫做 系统 性 能 评估 协会 
(SPEC) 的 非 营 利 组 织 选 择 并 公布 不 同 应 用 领域 中 具有 代表 性 的 应 用 程序 以 及 许多 商业 应 用 计 
算 机 的 测试 结果 。1989 年 为 通用 型 计算 机 选择 了 一 套 基 准 程序 。1995 年 和 2000 年 先后 对 它 进 行 
了 少量 的 修改 ， 并 做 了 再 版 。 

程序 的 选择 范围 从 游戏 比赛 、 编 译 程序 、 数 据 库 应 用 到 天 体 物理 学 和 量子 化 学 中 的 数字 集 
约 程序 。 每 种 情况 下 ， 程 序 都 在 被 测试 的 计算 机 上 编译 并 且 得 出 在 实际 计算 机 上 的 运行 结果 
(不 允许 仿真 )。 在 选择 的 一 台 作为 参照 的 计算 机 上 同样 的 程序 也 要 被 进行 编译 和 运行 。 对 于 
SPEC95 ， 参 照 的 是 SUN SPARCstation 10/40, 对 于 SPEC2000， 参 照 的 是 使 用 300MHz 
UltraSPARCII 处 理 器 的 UltraSPARC 10 工 作 站 。SPEC 的 等 级 计算 如 下 : 


SPEC 的 等 级 = _ 在 参 昭 计算 机 上 的 运行 时 间 
在 被 测试 计算 机 上 的 运行 时 间 
如 果 SPEC 的 等 级 是 50， 表 示 在 该 特定 基准 下 ， 被 测 计算 机 运行 速度 是 UltraSPARC 10 的 50 倍 。 
在 SPEC 组 内 对 所 有 程序 测试 是 重复 进行 的 ， 并 且 计算 的 结果 是 几何 平均 的 。 令 SPEC 为 组 中 第 ; 
个 程序 的 等 级 。 则 计算 机 总 的 SPEC 等 级 为 : 


1 


SPEC 的 等 级 = [Tiseac J 
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这 里 4 为 组 中 的 程序 数 ， 

因为 实际 的 执行 时 间 被 测量 出 来 ，SPEC 等 级 是 影响 性 能 的 全 部 因素 的 组 合 效果 的 测量 值 ， 
包括 编译 程序 、 操 作 系统 、 处 理 器 和 被 测 计算 机 的 存储 器 。 关 于 SPEC 基 准 程序 和 测试 处 理 结 
果 的 细节 可 在 SPEC 网 页 中 中 找到 。 


1.7 多 处 理 器 和 多 计算 机 


至 此 ， 我 们 所 介绍 的 计算 机 是 只 有 一 个 处 理 器 的 计算 机 。 大 型 计算 机 系统 中 可 能 包含 有 许 
多 处 理 器 单元 ， 这 种 系统 称 为 多 处 理 器 系统 。 这 些 系 统 中 的 每 个 处 理 器 并 行 执行 许多 不 同 的 应 
用 任务 或 一 个 独立 的 大 型 任务 中 的 子 任务 。 在 这 样 的 系统 中 所 有 处 理 器 通常 有 权利 访问 这 种 系 
统 中 的 所 有 内 存 ， 并 且 经 常 使 用 共享 存储 器 多 处 理 器 系统 来 清楚 地 表明 这 一 点 。 系 统 的 这 些 高 
性 能 使 得 复杂 性 和 成 本 大 大 增加 。 除 了 多 处 理 器 和 存储 器 单元 之 外 ， 因 为 需要 更 多 复杂 的 互 连 
网 络 也 使 成 本 不 断 增 加 。 

和 多 处 理 器 系统 相 比 ， 使 用 一 个 完整 计算 机 互 连 组 来 达到 总 的 高 计算 能 力也 是 可 行 的 。 这 
些 计算 机 通常 只 访问 它们 自己 的 存储 器 ， 当 任务 的 执行 中 需要 数据 传递 时 ， 它 们 用 通信 网 交换 
信息 的 方式 来 实现 。 这 一 特点 将 它们 与 共享 存储 器 的 多 处 理 器 区 别 开 来 ， 因 此 将 它们 命名 为 信 
息 传递 多 计算 机 系统 。 

共享 存储 器 多 处 理 器 和 信息 传递 多 计算 机 系统 ， 以 及 这 类 系统 中 的 互连网 络 将 在 第 12 章 中 
描述 。 
1.8 发 展 历程 


我 们 现在 所 知道 的 计算 机 已 经 有 超过 60 年 的 历史 。 在 计算 机 被 发 明之 前 有 一 段 漫 长 的 机 械 
计算 设备 发 展 的 过 程 。 这 段 历史 有 很 多 的 原始 描述 。 例 如 ，Hayes 外 非常 好 地 描述 了 计算 机 的 
历史 ， 包 括 日 期 、 发 明 者 、 设 计 者 、 研 究 机构 和 制造 商 。 这 里 ， 我 们 只 简要 地 描述 一 下 计算 机 
发 展 的 历程 。 | 

在 20 世 纪 中 叶 之 前 的 300 年 里 ， 一 系列 由 齿轮 、 杠 丁 和 滑轮 构成 的 越 来 越 复杂 的 机 械 装 置 ， 
被 用 来 做 基本 的 加 、 减 、 乘 、 除 操作 。 穿 孔 卡 片上 的 孔 被 机 器 感知 后 自动 控制 一 系列 的 计算 ， 
这 是 当时 提供 的 主要 编程 能 力 。 这 些 设备 可 以 计算 完整 的 对 数 表 和 使 用 多 项 式 近 似 的 三 角 函数 
表 ， 输 出 结果 被 穿孔 在 卡片 上 或 打印 在 纸 上 。 在 第 二 次 世界 大 战 期 间 ， 电 动机 械 传动 设备 ， 比 
如 像 使 用 在 早期 电话 转换 系统 中 的 设备 ， 提 供 了 计算 机 构造 中 执行 逻辑 功能 的 方法 。 同 时 ， 第 
一 台 用 于 无 线 电 和 军事 雷达 设备 中 的 基于 真空 管 技术 的 电子 计算 机 在 宾夕法尼亚 大 学 设计 制造 
完成 。 真 空 管用 来 执行 逻辑 运算 和 存储 数据 。 这 项 技术 开创 了 电子 数字 计算 机 的 新 纪元 。 

计算 机 的 处 理 器 、 存 储 器 和 IO 设备 的 制造 技术 的 发 展 分 为 四 代 : 第 一 代为 1945~1955 年 ; 
第 二 代为 1955~1965 年 ; 第 三 代 是 1965~1975 年 ; 第 四 代 是 从 1975 年 至 今 。 


1.8.1 第 一 代 计 算 机 


程序 存储 的 核心 概念 是 由 John von Neumann 提 出 的 。 程 序 和 程序 中 使 用 的 数据 被 放 在 同一 
个 存储 器 中 ， 就 像 今天 这 样 。 汇 编 语言 用 来 准备 程序 并 将 它 转换 成 可 执行 的 机 器 语言 。 

使 用 真空 管 技术 实现 的 逻辑 功能 ， 基 本 算术 运算 只 需要 执行 几 毫 秒 。 这 比 早 期 的 机 械 和 基 
于 传动 的 电动 机 械 技术 的 速度 要 快 100~1000 倍 。 最 初 使 用 的 是 镀 银 延迟 线 存 储 器 ， 而 1O 功 能 


[18 | 


[19 | 





—dA —  _ _ 1 站 


由 类 似 打 字 机 的 设备 完成 ， 还 开发 出 了 磁 心 存储 器 和 磁带 存储 设备 。 
1.8.2 第 二 代 计 算 机 


在 20 世 纪 40 年 代 后 期 Ar&T 贝 尔 实验 室 发 明了 晶体 管 ， 并 迅速 用 它 取 代 了 真空 管 。 这 一 基 
础 技术 的 转变 标志 着 第 二 代 计 算 机 的 开始 。 在 第 二 代 计 算 机 中 广泛 使 用 了 磁 心 存储 器 和 磁 鼓 存 
储 设备 ， 开 发 出 了 像 Fortran 这 样 的 高 级 语言 ， 使 得 应 用 程序 的 制作 更 为 容易 。 称 为 编译 程序 的 
系统 程序 也 被 开发 出 来 ， 它 将 高 级 语言 程序 翻译 成 相应 的 汇编 语言 程序 ， 这 些 汇 编 语言 然后 再 
被 翻译 成 可 热 行 的 机 器 语言 形式 。 在 这 一 时 期 还 开发 出 了 独立 的 MO 处 理 器 ， 它 可 以 与 中 央 处 理 
器 并 行 操作 所 执行 的 程序 ， 从 而 提高 了 总 的 执行 性 能 。 在 这 一 时 期 中 ，IBM 公 司 成 为 了 主要 的 
计算 机 制造 商 。 


1.8.3 第 三 代 计 算 机 


在 一 个 独立 的 硅 芯 片上 建造 许多 晶体 管 的 能 力 即 是 集成 电路 技术 ， 它 可 以 建造 低 成 本 的 高 
速 处 理 器 和 存储 单元 。 集 成 电路 存储 器 开始 取代 磁 心 存储 器 。 这 一 技术 的 发 展 标志 着 第 三 代 计 
算 机 的 开始 。 在 这 个 时 期 还 发 展 了 其 他 技术 ， 诸 如 采用 的 微 编程 、 并 行 性 和 流水 线 技术 。 操 作 
系统 软件 可 以 使 若干 个 用 户 程序 有 效 地 分 享 计算 机 系统 。 还 开发 了 高 速 缓存 和 虚拟 存储 技术 。 
高 速 缓存 使 得 主 存储 器 看 起 来 比 实际 要 快 ， 而 虚拟 存储 使 它 看 起 来 比 实 际 的 存储 器 要 大 。IBM 
公司 的 系统 360 主 机 和 Digital Equipment (数字 设备 ) 公司 的 PDP 系 列 小 型 机 主宰 了 第 三 代 计 算 
机 的 商用 产品 市 场 。 


1.8.4 第 四 代 计算 机 


在 20 世 纪 70 年 代 初 ， 集 成 电路 制造 技术 已 经 达到 小 型 计算 机 中 整个 的 处 理 器 和 大 部 分 主 存 
储 器 可 以 集成 在 单个 芯片 上 的 程度 。 数 以 万 计 的 晶体 管 可 以 放置 在 一 块 芯片 上 ， 超 大 规模 全 成 
EI (VLSI) 这 一 名 词 描述 了 这 项 技术 。VLSI 技术 使 得 一 个 完整 的 处 理 器 可 以 在 一 块 芯片 上 
制造 ， 这 就 是 微 处 理 器 。 一 些 公 司 如 Intel、National Semiconductor, Motorola, Texas 
Instruments 和 Advanced Micro Devices 是 这 一 技术 的 推动 者 。 

诸如 并 行 、 流 水 线 、 高 速 缓存 和 虚拟 存储 器 等 组 成 结构 的 概念 用 在 了 当今 第 四 代 成 熟 的 高 
性 能 计算 系统 的 生产 中 。 由 局 域 网 、 广 域 网 或 因特网 互联 的 笔记 本 电脑 、 台 式 个 人 电脑 和 工作 
站 已 经 成 为 计算 的 主体 方式 。 在 主机 上 的 集中 式 计算 现在 主要 用 于 大 型 公司 的 商业 应 用 中 。 


1.8.5 后 第 四 代 计算 机 


后 第 四 代 计 算 机 有 时 用 来 描述 一 些 具 有 支配 机 构 或 应 用 驱动 能 力 的 计算 机 系统 。 近 年 来 ， 
在 描述 这 些 逐 步 形成 的 系统 时 ， 倾 向 于 使 用 这 些 特征 而 不 是 使 用 时 代 序 号 。 人 工 智能 型 计算 机 、 
大 型 并 行 机 、 广 域 分 布 式 系统 是 当今 趋势 的 范例 。 或 许 最 重要 的 是 ， 计 算 机 产业 的 发 展 依赖 于 
功能 日 益 强大 并 且 大 众 支 付 得 起 的 台式 机 ， 以 及 广泛 使 用 的 因特网 上 的 大 量 信息 资源 。 


1.8.6 性 能 的 发 展 


从 机 械 和 电动 机 械 设备 向 最 初 基于 真空 管 的 电子 设备 的 转变 带 来 了 100~1000 倍 速度 上 的 提 
高 ， 从 秒 级 提升 到 毫秒 级 。 唱 体 管 取代 真空 管 的 更 替 带 来 了 另 一 个 1000 倍 的 速度 提高 ， 基 本 操 
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作 可 以 在 微 秒 内 执行 。 集 成 电路 制造 中 日 益 提 高 的 密度 产生 了 当今 在 毫 微 秒 或 更 短 的 时 间 内 执 
行 基本 操作 的 微 处 理 器 芯片 ， 又 使 速度 有 了 1000 倍 的 提高 。 除 了 技术 上 的 发 展 ， 在 计算 机 体系 
结构 上 还 产生 了 许多 新 方法 ， 比 如 对 计算 机 性 能 有 显著 影响 的 高 速 缓 存 和 流水 线 技术 的 使 用 等 。 
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这 一 章 介绍 了 计算 机 结构 和 操作 方面 的 许多 内 容 。 对 许多 与 主题 有 关 的 术语 都 作 了 介绍 ， 
也 概述 了 一 些 重要 的 设计 概念 。 后 面 的 章节 将 对 这 些 术 语 和 概念 做 出 完整 的 解释 ， 还 会 对 本 章 
各 部 分 的 内 容 做 适当 的 分 析 。 


习题 


1.1 按照 图 1-2 中 所 示 的 部 件 之 间 的 数据 项 传递 和 一 些 简 单 的 控制 命令 列 出 下 面 机 器 指令 所 需 步 又 
Add LOCA, RO 
假设 指令 本 身 存储 在 内 存 中 的 INSTR 单 元 中 ， 并 且 该 地 址 开始 在 寄存 器 PC 中 。 前 两 步 可 能 为 
* 将 寄存 器 PC 中 的 内 容 传 送 到 寄存 器 MAR 中 。 
“ 给 内 存 下 达 一 条 读 的 命令 ， 然 后 等 待 它 将 请 求 送 到 寄存 器 MDR 中 。 
注意 包括 需要 从 INSTR 到 INSTR+1 的 PC 内 容 的 更 新 ， 以 便 可 以 取出 下 一 条 指令 。 
1.2 对 在 1.6.3 节 中 讨论 的 机 器 指令 
Add R1, R2, R3 
重复 习题 1.1。 

1.3 (a) 对 任务 “将 存储 单元 A 和 B 中 的 内 容 相 加 ， 并 将 结果 放 到 单元 C 中 ”给 出 一 个 机 器 指令 的 

短 序列 。 指 令 

Load LOC, R, 
及 

Store R, LOC 
是 用 于 在 内 存 和 通用 寄存 器 Ri 之 间 传 递 数据 的 惟一 可 用 指令 。Add 指 令 在 1.3 节 和 1.6.3 节 中 
进行 了 描述 。 不 要 破坏 单元 A 和 B 中 的 内 容 。 
(b) 假设 Move 和 Add 指 令 可 用 格式 有 : 

Move/Add Location1, Location2 

这 些 指令 传送 或 添加 一 个 操作 数 副 本 从 Location1 到 Location2， 和 覆盖 第 2 个 位 置 中 原 有 操作 数 
内 容 。Locationi 既 可 以 在 内 存 中 也 可 以 在 处 理 器 寄存 器 中 。 是 否 可 以 使 用 较 少 的 指令 完成 
(a) 部 分 中 的 任务 ?如 果 可 以 ,请 给 出 序列 。 

14 (a) 在 1.5 节 中 讨论 了 一 个 程序 集合 的 输入 输出 步骤 ， 如 图 1-4 所 示 ， 可 以 进行 重 登 以 减少 总 
的 执行 时 间 。 令 每 6 个 OS 程 序 执行 间隔 为 1 个 时 间 单 位 ， 其 中 每 个 磁盘 操作 需要 3 个 单位 ， 
打印 需要 3 个 单位 ， 每 个 程序 执行 间隔 需要 2 个 时 间 单 位 。 计 算 对 于 一 个 长 程序 序列 最 佳 重 
登 时 间 与 不 重 伙 时 间 的 比 。 忽 略 开始 和 结束 的 瞬间 时 间 。 

(b) 1.5 节 说 明 程 序 计算 可 以 分 别 与 输入 或 输出 操作 重 登 或 是 同时 与 两 者 重 私 。 忽 略 OS 程 序 
需要 的 相对 较 短 的 时 间 ， 对 于 一 个 程序 集合 整个 的 执行 ， 最 佳 重 登 时 间 与 不 重 倒 时 间 的 比 





16 


1.5 


是 多 少 ? 每 个 程序 在 输入 、 计 算 和 输出 活动 上 如 何平 衡 ? 

(a) 在 1.6.2 节 提 到 的 程序 执行 时 间 7 用 于 检测 某 些 高 级 语言 程序 。 程 序 可 以 在 一 台 RISC 或 
CISC 计 算 机 上 运行 。 这 两 者 都 使 用 流水 线 指令 执行 ， 但 是 RISC 机 器 上 的 流水 线 比 CISC 机 器 
上 的 效率 更 高 。 具 体 地 说 ，T 表 达 式 中 5 的 有 效 值 在 RISC 机 器 上 为 1.2, 但 在 CISC 机 器 上 只 有 
1.5。 两 台 机 器 有 着 相同 的 时 钟 频率 RX*。 如 果 在 CISC 机 器 上 与 RISC 机 器 上 的 执行 时 间 一 样 长 ， 
那么 N 的 最 大 允许 值 (CISC 机 器 上 的 指令 执行 数 ) 与 RISC 机 器 上 的 N 值 百分比 是 多 少 ? 

(b) 当时 钟 频率 R 在 RISC 机 器 上 EECISC 机 器 上 快 15% 时 ， 重 复 (a) 部 分 中 的 问题 。 

(a) 在 1.6 节 中 讨论 过 ， 如 图 1-5 所 示 的 一 个 处 理 器 高 速 缓存 。 假 设 一 个 程序 的 执行 时 间 正 好 
与 指令 访问 时 间 成 比例 ， 并 且 在 高 速 缓存 中 访问 一 条 指令 比 在 主 存 中 访问 一 条 指令 快 20 倍 。 
假设 指令 在 高 速 缓存 中 的 概率 为 0.96， 还 假设 如 果 指 令 在 高 速 缓存 中 没有 找到 ， 必 须 首先 将 
它 从 主 存 中 读 取 出 来 送 到 高 速 缓 存 中 ， 然 后 从 高 速 缓存 中 取出 再 被 执行 。 计 算 没 有 高 速 组 
存 与 有 高 速 缓存 情况 下 程序 执行 时 间 的 比值 。 这 个 比值 通常 定义 为 由 于 存在 高 速 缓存 而 获 
得 的 加 速 因子 。 

(b) 如 果 高 速 缓存 的 大 小 加 倍 ， 同 时 假设 在 其 中 找 不 到 所 需 指令 的 概率 碱 半 ， 对 于 双 倍 大 小 
的 高 速 缓存 重复 (9) 部 分 中 的 问题 。 


参考 文献 


1. D.A. Patterson and J.L. Hennessy, Computer Organization and Design — The 
Hardware/Software Interface, 2nd ed., Morgan Kaufmann, San Mateo, Calif., 1998. 


2. System Performance Evaluation Corporation web page: www.spec.org. 


3. J.P. Hayes, Computer Architecture and Organization, 3rd ed., McGraw-Hill, New 
York, 1998. 





第 2 章 


机 器 指令 和 程序 


本 章 目标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

* 机 器 指令 和 程序 的 执行 ， 包 括 程序 转移 、 子 程序 调用 以 及 返回 操作 
* 数 的 表示 以 及 在 二 进 制 补 码 系统 中 的 加 法 /减法 

* 访问 寄存 器 和 存储 器 的 操作 数 寻 址 方式 

“ 用 于 表示 机 器 指令 、 数 据 和 程序 的 汇编 语言 

“程序 控制 的 输入 /输出 操作 

* 基于 堆栈 、 队 列 、 列 表 、 链 表 和 数组 等 数据 结构 的 操作 


这 一 章 我 们 从 机 器 指令 集 的 角度 来 考虑 程序 在 计算 机 中 的 执行 方法 。 第 1 章 已 经 介绍 了 存 
储 在 内 存 中 的 程序 指令 和 数据 操作 数 的 一 般 概 念 , 本 章 将 学 习 指令 序列 从 存储 器 传递 到 处 理 器 ， 
并 完成 给 定 任务 的 方法 。 寻 址 方式 通常 用 于 访问 在 内 存单 元 和 所 使 用 的 处 理 器 寄存 器 中 的 操 
作 数 。 

这 里 强调 的 是 基本 概念 。 我 们 用 一 种 通用 的 方式 描述 机 器 指令 和 操作 数 的 寻 址 方式 ， 这 种 
方式 是 商用 处 理 器 的 典型 方式 。 本 章 将 介绍 足够 的 指令 和 寻 址 方式 ， 以 便于 能 够 给 出 一 个 针对 
简单 任务 的 完整 旦 真实 的 程序 。 这 些 通用 程序 用 汇编 语言 进行 了 说 明 。 在 汇编 语言 中 ， 机 器 指 
令 和 操作 数 寻 址 信息 用 符号 名 来 表示 。 完 整 的 指令 集 通常 称 为 处 理 器 的 指令 集体 系 结构 (ISA, 
instruction set architecture)， 其 中 除了 对 指令 做 具体 说 明 外 、ISA 中 还 详细 说 明了 用 于 访问 数据 操 
作 数 和 该 指令 用 到 的 处 理 器 寄存 器 的 寻 址 方式 。 在 本 章 中 我 们 对 基本 概念 进行 讨论 ， 不 需要 定 
义 完整 的 指令 集 ， 因 此 所 采用 的 方式 是 给 出 足够 的 例子 去 说 明 所 需要 的 性 能 。 

第 3 章 介绍 了 由 ARM、Motorola 和 Intel 公 司 生产 的 三 种 商用 处 理 器 的 [SA， 本 章 中 的 通用 程 
序 在 第 3 章 中 按照 这 三 种 指令 集 再 次 分 别 给 出 ， 为 读者 提供 来 自 于 实际 机 器 的 例子 。 

大 多 数 的 程序 是 用 高 级 语言 编写 的 ， 比 如 用 C、C++、Java 或 Fortran。 在 本 书 中 使 用 汇编 语 
言 编 程 主要 是 为 了 描述 计算 机 是 如 何 操 作 的 。 为 了 在 处 理 器 上 执行 高 级 语言 程序 ， 这 个 程序 必 
须 首 先 被 解释 成 该 处 理 器 上 的 汇编 语言 。 汇 编 语言 是 机 器 语言 的 一 种 易 读 形式 。 高 级 语言 与 机 
器 语言 之 间 的 特征 关系 是 计算 机 设计 中 需要 考虑 的 一 个 关键 问题 ， 我 们 也 将 多 次 讨论 。 

所 有 的 计算 机 都 可 以 处 理 数 字 ， 它 们 具有 执行 数据 运算 对 象 的 基本 算术 运算 指令 。 同 样 ， 
在 一 个 程序 的 机 器 指令 执行 过 程 中 ， 需 要 运行 算术 操作 去 生成 一 些 数 字 ， 这 些 数 字 表 示 在 存储 
器 中 被 访问 的 操作 数 单元 的 地 址 。 要 了 解 这 些 任 务 是 如 何 实现 的 ， 必 须 首先 知道 数字 在 计算 机 
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中 是 如 何 表示 的 ， 以 及 这 些 数字 在 做 加 法 和 减法 运算 时 是 如 何 被 操作 的 。 因 此 ， 在 本 章 的 第 1 节 
我 们 将 介绍 这 些 主题 。 有 关 实 现 计 算 机 算术 运算 的 逻辑 电路 将 在 第 6 章 详细 讨论 。 

除了 数字 数据 外 ， 为 了 处 理 文本 信息 计算 机 还 要 处 理 字符 和 字符 串 。 本 章 的 第 ! 节 描述 了 字 
符 在 计算 机 中 是 如 何 表示 的 。 


2.1 数 、 算 术 运 算 以 及 字符 


计算 机 建立 在 用 二 值 电 信号 (参见 附录 A) 表示 信息 的 逻辑 电路 的 基础 上 。 我 们 把 这 两 个 值 
说 成 是 “0” 和 “1”， 并 且 定 义 使 用 这 种 信号 表示 的 信息 量 是 一 个 信息 位 ， 这 里 的 一 位 表示 一 个 
二 进 制 数 。 在 计算 机 系统 中 表示 数 的 最 基本 方法 是 使 用 一 串 位 ， 即 一 个 二 进 制 数 。 文 本 字符 也 
可 以 用 一 串 位 表示 ， 叫 做 字符 码 。 | 

我 们 首先 介绍 二 进 制 数 的 表示 和 对 这 些 数 的 算术 运算 ， 然 后 描述 字符 的 表示 方式 。 


2.1.1 数 的 表示 


考虑 一 个 n 位 的 向 量 
B = b,-1…bibo 
XETO<i<n-1, b =0821, KAREE? — 1 的 范围 内 可 以 用 无 符号 整数 V 表 示 ， 这 里 
VB)=b x 2-1 +... +bix 2! + box20 

显然 需要 表示 正 数 和 负数 ， 有 三 种 系统 可 以 用 来 表示 这 些 数 : 

。 原 码 

。 反 码 

。 补 码 

在 这 三 种 编码 体系 中 ， 最 左边 一 位 为 “0” 时 表示 正 数 ， 为 “1” 时 表示 负数。 图 2-1 用 4 位 
数 举例 说 明了 在 这 三 个 体系 中 数字 的 表示 方法 。 在 所 有 的 编码 体系 中 正 数 的 表示 法 相同 ， 而 负 
数 有 着 不 同 的 表示 方法 。 在 原 码 系统 中 ， 负 数值 是 将 向 量 B 相 应 的 正 数值 的 最 高 有 效 位 (在 图 2- 
1 中 的 bs) 由 0 变 为 1 来 表示 的 。 例 如 : +5 表 示 为 0101，- 5 表示 为 1101。 在 反 码 表示 中 ， 负 数 是 
由 相应 的 正 数 中 的 每 一 位 的 值 求 反而 获得 的 。 因 此 ， 对 于 - 3 来 说 ， 对 向 量 0011 的 各 位 求 反 就 得 
到 了 1100。 显然 ， 运 用 同样 的 按 位 求 反 操作 也 可 以 把 一 个 负数 转换 成 相应 的 正 数 。 这 两 种 转换 
方法 称 为 一 个 给 定数 的 反 码 形式 。 对 于 一 个 给 定数 做 反 码 形式 的 操作 相当 于 从 2 — 1 中 减 去 这 个 
数 ， 在 图 2-1 中 的 4 位 数 情况 下 也 就 是 从 1111 中 减 去 该 数 。 最 后 在 补 码 系统 中 ， 一 个 数 的 补 码 是 从 
2 中 减 去 这 个 数 而 得 到 的 。 

因此 ， 一 个 数 的 补 码 可 以 用 这 个 数 的 反 码 加 1 而 获得 。 

值得 注意 的 是 在 原 码 和 反 码 系统 中 对 于 “+0” 和 “-- 0” 有 着 截然 不 同 的 表示 ， 而 在 补 码 
系统 中 对 “0” 只 有 一 种 表示 。 对 4 位 数 来 说 ， 在 补 码 系统 中 对 数值 -8 有 表示 ， 而 在 其 他 系统 
中 却 设 有 。 原 码 系统 看 似 最 接近 自然 数 ， 因为 在 笔算 中 我 们 就 是 用 原 码 处 理 十 进 制 数 的 。 反 
码 系统 容易 与 这 个 系统 关联 起 来 ， 而 补 码 系 统 看 起 来 就 不 自然 了 。 但 是 ， 我 们 将 会 在 2.1.3 节 
中 说 明 补 码 系统 为 进位 加 法 和 减法 运算 提供 了 最 有 效 的 方法 。 它 是 在 计算 机 中 最 常用 的 方法 
之 一 。 
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图 2-1 二 进 制 有 符号 整数 的 表示 
2.1.2 正 数 的 加 法 


考虑 两 个 1 位 数 相 加 ， 这 个 结果 在 图 2-2 中 给 出 。 注 意 1 加 1 的 和 需要 一 个 2 位 向 量 10 米 表示 数值 
2。 我 们 说 这 个 和 是 0， 进 位 是 1。 为 了 完成 多 位 数 相 加 ， 使 用 一 种 类 似 于 十 进 制 数 笔算 中 使 用 的 方 
法 。 从 这 个 位 向 量 的 最 低位 (右边) 开始 进行 两 位 相 加 ， 并 将 进位 传递 到 它 的 高 位 (左边 ) 上 去 。 





图 2-2 1 位 数 的 加 法 


2.1.3 有 符号 数 的 加 法 和 减法 


我 们 介绍 了 表示 正 数 和 负数 (或 简称 为 有 符号 数 ) 的 三 种 系统 。 这 些 系 统 的 不 同 之 处 仅 在 
于 对 负数 的 表示 方式 。 从 执行 算术 运算 容易 性 的 观点 来 看 它们 的 相应 优势 可 以 归纳 如 下 : 自然 
数 表示 法 在 表示 上 是 最 简单 的 ， 但 是 它 对 于 加 法 和 减法 的 运算 也 是 最 不 便 的 。 反 码 表 示 法 稍微 
好 一 些 ， 补 码 系统 对 于 执行 加 法 和 减法 运算 是 最 有 效 的 。 

为 了 理解 补 码 的 算术 运算 ， 考 虑 以 N 为 模 的 加 法 (写成 mod N)。 对 于 描述 正 整 数 mod N 加 法 
的 有 效 图 示 方式 是 使 用 一 个 具有 N 个 值 的 贺 ，0 到 N -1 是 圆周 上 的 标记 ， 如 图 2-3a 所 示 。 考 虑 当 
N = 16 的 情况 ，(7+4) mod 16 运 算 产 生 的 值 是 11。 为 了 使 用 图 形 执行 这 个 操作 ， 在 圆 上 找到 7 的 位 
置 然后 按 顺 时 针 方向 移动 4 个 单位 就 到 达 了 答案 11。 类 似 地 ，(9 + 14) mod 16 = 7; 在 圆 上 找到 9 然 
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后 按 硕 时 针 方 向 移动 14 个 单位 就 到 达 答 案 7。 这 种 计算 (a+b) mod 16 的 图 形 技术 ， 对 于 任何 正 数 a 
和 b 都 是 有 效 的 。 即 为 了 完成 加 法 ， 定 位 4， 然后 按 硕 时 针 向 前 移动 bp 个 单位 就 可 以 得 到 (a+b) mod 
16 的 结果 。 
现在 考虑 对 于 模 数 为 16 的 圆 的 另 一 种 不 同 解释 。 将 数值 0 到 15 用 相应 的 二 进 制 数 系统 中 的 4 
位 向 量 0000, 0001, …, 1111 来 表示 。 然 后 按照 补 码 方式 ( 见 图 2-1) 重新 将 这 些 二 进 制 向 量 解 释 成 
从 一 8 到 +7 的 有 符号 数 ， 如 图 2-3b 所 示 。 
让 我 们 将 mod 16 的 加 法 技术 应 用 在 将 +7 加 到 - 3 的 一 个 简单 例子 上 。 对 于 这 两 个 数 的 补 码 表 
示 分 别 是 0111 和 1101。 为 了 完成 两 数 相 加 ， 在 图 2-3b 的 圆周 上 找到 0111， 然 后 按 顺 时 针 方 向 移动 
1101 (13) 步 到 达 了 0100， 得 到 了 +4 的 正确 答案 。 如 果 用 从 右 到 左 的 按 位 加 方法 完成 这 个 加 法 ， 
我 们 得 到 : 
0111 
+1101 
10100 
t 
进位 
注意 ， 如 果 在 这 个 加 法 中 忽略 第 四 位 上 的 进位 ， 就 得 到 了 一 个 正确 的 答案 。 实 际 上 就 是 这 
样 做 的 。 忽 略 这 个 进位 是 用 N 取 模 算法 的 自然 结果 。 当 我 们 在 图 2-3b 中 绕 着 圆 移动 时 ， 对 于 1111 
值 的 下 一 个 值 通常 应 该 是 10000。 然 后 ， 又 返回 到 了 0000 值 。 现 在 来 陈述 使 用 补 码 表示 系统 的 
位 有 符号 数 的 加 法 和 减法 规则 。 








a) 整数 模 N 的 圆 的 表示 b) 二 进 制 补 码 数 的 模 为 16 的 系统 
图 2-3 模 数 系统 和 补 码 系统 3 


L. 两 个 数 相 加 ， 它 们 的 "个 表示 位 相 加 ， 在 最 高 有 效 位 (MSB) 上 忽略 进位 符号 。 它 们 的 和 
将 是 用 补 码 表示 的 代数 运算 的 正确 值 ， 只 要 结果 是 在 -2"-! 到 +2"-!- 1 的 范围 之 内 。 

2 X 和 1 了 两 个 数 相 减 时 ， 也 就 是 执行 X- 7 时， 求 出 7 的 补 码 形式 然后 按照 规则 1 将 它 加 到 X 中 。 
同样 ， 如 果 结 果 是 在 - 2- ' 到 +2 1 的 范围 内 ， 其 结果 将 是 用 补 码 表示 的 代数 运算 的 正确 值 。 

在 图 2-4 中 给 出 了 一 些 加 法 和 减法 的 例子 。 在 所 有 这 些 4 位 数 的 例子 中 ， 结 果 不 会 超过 — 8 到 
+7 的 表示 范围 。 当 结果 没有 在 表示 范围 之 内 时 ， 便 发 生 了 算术 溢出 。 这 种 情况 将 在 下 一 节 讨论 ， 
图 2-4 中 (a) 到 (b) 的 四 个 加 法 运算 符合 规则 1，(e) 到 6) 的 六 个 减法 运算 符合 规则 2。 减 法 运算 要 
求 减 数 (算式 中 下 面 的 值 ) 转换 为 补 码 形式 ， 不 论 减 数 为 正 数 或 负数 ， 用 这 样 的 变换 操作 其 结 
果 都 是 正确 的 。 





0010 (+2) 
+ 0011 (+3) 


0101 (+5) 


1011 (-5) 
+1110 (-2) 


1001 (-7) 


1101 (-3) 
- 1001 





图 2-4 补 码 的 加 、 减 法 操作 


在 补 码 系统 中 我 们 经 常 需要 用 比 给 定数 要 多 的 位 数 来 表示 一 个 数 。 对 于 一 个 正 数 ， 用 左边 
加 0 的 方法 实现 。 对 于 负数 ， 最 左边 的 位 是 (符号 位 ) 等 于 1， 有 具有 同样 值 的 较 长 位 数 的 数 可 以 
用 在 左边 根据 需要 多 次 重复 符号 位 来 实现 。 为 了 理解 为 什么 这 样 做 是 正确 的 ， 考 查 图 2-3b 中 的 
模 为 16 的 圆 。 将 它 与 比较 大 的 圆 ， 即 模 为 32 或 模 为 64 的 情况 做 比较 ， 对 于 值 - 1、-- 2 等 的 表示 ， 
它们 完全 相同 ， 只 是 用 若干 个 1 加 到 了 左边 。 概 要 地 说 ， 在 补 码 系统 中 用 一 个 大 一 些 的 位 数 表示 
一 个 有 符号 数 时 ， 按 需要 在 左边 重复 它 的 符号 位 。 这 种 操作 称 为 符号 扩展 。 

利用 补 码 表 示 法 简化 了 有 符号 数 的 加 法 或 减法 操作 ， 这 就 是 现代 计算 机 采用 补 码 表示 法 的 
理由 。 看 起 来 似乎 反 码 表示 法 与 补 码 表示 法 一 样 有 效 ， 但 是 尽管 数 的 求 反 很 容易 ， 可 是 加 法 运 
算 以 后 生成 的 结果 却 不 能 保证 总 是 正确 的 。 进 位 c, 不 能 被 忽略 。 如 果 c. = 0， 得 到 的 结果 是 正确 
的 ， 如 果 cr =1， 必 须 对 这 个 结果 加 上 1， 以 保证 它 的 正确 性 。 是 否 需要 做 这 个 修正 是 以 加 法 操作 
是 否 产 生 进位 输出 为 条 件 的， 这 就 意味 着 加 法 和 减法 运算 在 反 码 系统 中 不 能 像 在 补 码 系统 中 那 
样 方便 地 实现 。 


2.1.4 整数 算术 运算 中 的 溢出 


在 使 用 补 码 表示 数字 的 系统 中 ，n 位 可 表示 的 值 在 -2-! 到 +2"-!-1 之 间 。 例 如 ， 使 用 4 位 可 
以 表示 数 的 范围 是 - 8 到 +7， 就 像 在 图 2-1 中 给 出 的 那样 。 当 算术 运算 的 结果 超出 了 这 个 表示 范 
围 时 、 就 发 生 了 一 个 算术 溢出 。. 
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当 无 符号 数 相 加 时 ， 最 高 有 效 位 上 的 进位 输出 c, 作为 溢出 标志 。 但 是 这 种 方法 对 于 有 符号 
数 相 加 不 起 作用 。 比 如 ， 当 使 用 4 位 有 符号 数 时 ， 如 果 我 们 将 +7 和 +4 相 加 ， 输 出 的 和 有 向量? 是 
1011， 它 是 数值 - 5 的 代码 ， 是 一 个 不 正确 的 结果 。 从 MSB (最 高 有 效 位 ) 位 上 得 到 的 进位 输出 
信号 应 该 是 9。 类 似 地 ， 如 果 我 们 将 -4 和 一 6 相 加 ， 得 到 S = 0110 = +6， 又 是 一 个 错误 的 结果 ， 
因为 在 这 种 情况 下 进位 输出 信号 应 该 为 !。 因 此 ， 如 果 两 个 加 数 有 着 同样 的 符号 ， 就 可 能 产生 涪 
出 。 显 然 ， 使 用 不 同 符号 的 数 做 加 法 时 不 会 产生 溢出 。 这 样 得 出 了 以 下 结论 : 

1. 只 有 当 两 个 具有 相同 符号 的 数 相 加 时 才 会 产生 溢出 。 

2. 当 对 有 符号 数 做 加 法 运算 时 ， 从 符号 位 传 来 的 进位 输出 信号 不 能 充分 说 明 发 生 了 溢出 。 

检测 溢出 的 一 个 简单 方法 是 测试 两 个 加 数 X 和 了 的 符号 ， 以 及 结果 的 符号 。 当 两 个 操作 数 X 
和 Y 具 有 相同 的 符号 时 ， 而 结果 $ 的 符号 与 X 和 7 的 符号 不 同时 就 发 生 了 溢出 。 


2.1.5 字符 


除了 数字 以 外 ， 计 算 机 还 必须 能 够 处 理由 字符 组 成 的 非 数 字 的 文本 信息 。 字 符 可 以 是 字母 
字符 、 十 进 制 数 、 标 点 符号 等 等 。 它 们 通常 用 8 位 长 的 代码 来 表示 。 最 广泛 使 用 的 这 种 代码 之 一 
是 在 附录 E 中 描述 的 ASCII 码 。 


2.2 内 存单 元 和 寻 址 


数字 和 字符 操作 数 ， 以 及 指令 都 存储 在 计算 机 的 存储 器 中 。 现 在 我 们 考虑 存储 器 是 如 何 构 
成 的 。 存 储 器 是 由 几 百 万 个 存储 单元 构成 的 ， 其 中 每 个 单元 可 以 存储 一 位 具有 0 或 1 信和 的 信息 . 
由 于 单独 的 一 位 只 表示 信息 中 一 个 非常 小 的 
量 ， 所 以 很 少 单独 对 位 做 处 理 。 常 用 的 方法 
是 按 固定 大 小 的 组 对 位 做 处 理 。 为 了 这 个 目 
的 ， 对 存储 器 进行 构造 以 便于 对 位 一 组 的 数 
在 单独 的 基本 操作 中 进行 存储 或 检索 。 每 一 
个 n 位 组 称 为 一 个 字 ，n 称 为 字 长 。 计 算 机 的 
存储 器 可 以 用 图 表 方 式 表示 成 字 的 集合 ， 如 
图 2-5 所 示 。 

现代 计算 机 所 具有 的 字 长 的 一 般 范围 是 
从 16 位 到 64 位 之 间 。 如 果 一 台 计 算 机 的 字 长 
是 32 位 ， 那 么 如 同 图 2-6 所 示 ， 一 个 单独 的 字 
就 能 够 储存 一 个 32 位 的 补 码 数 或 是 四 个 各 占 
据 8 位 的 ASCI 码 字符 。8 位 的 一 个 单元 叫做 一 
个 字 节 。 机 器 指令 可 能 需要 用 一 个 或 多 个 字 
来 表示 。 在 描述 了 汇编 语言 级 的 指令 后 ， 在 
后 面 一 节 中 将 讨论 机 器 指令 是 如 何 被 编码 到 
存储 器 的 字 中 的 。 . 

为 了 储存 或 检索 一 个 信息 项 去 访问 存储 图 2-5 存储 器 中 的 字 
器 ， 访 信息 项 无 论 是 一 个 字 或 是 一 个 字 节 ， 对 于 每 一 项 的 位 置 要 有 具体 的 名 字 或 是 地 址 。 习 惯 上 
我 们 用 从 0 到 2: -1 的 数字 (# 取 一 些 适当 的 值 )， 作 为 存储 器 连续 单元 的 地 址 。2: 地 址 构成 了 计算 机 
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第 1 个 字 


第 2 个 字 


第 ;个 字 








的 地 址 空间 ， 而 存储 器 可 以 有 高 达 兴 的 可 寻 址 单元 。 例 如 ， 一 个 24 位 地 址 生成 一 个 2” (16 777 216) 
存储 单元 地 址 空间 。 这 个 数 通常 写成 16M， 这 里 1M 是 22 (1 048 576) 的 数 。 一 个 32 位 的 地 址 创建 
22 或 者 4G 的 存储 单元 地 址 空间 ， 这 里 1G 表 示 为 22。 其 他 的 惯用 标记 法 就 是 通常 用 K 来 表示 数 2 
(1022) ， 用 T 表 示 数 24。 








32 位 






pr ... 


t 符号 位 ，b31= 0 对 于 正 数 
b, = 1 对 于 负数 
a) 一 个 有 符号 整数 
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ASCII ASCII ASCII ASCII 
字符 字符 字符 字符 
b) 四 个 字符 


图 2-6 在 一 个 32 位 的 字 中 编码 信息 的 例子 
224 按 字 节 寻 址 能 力 


现在 有 三 种 基本 的 信息 处 理 量 : 位 、 字 节 和 字 。 一 个 字 节 通常 为 8 位 ， 但 字 长 通常 的 范围 B3 
是 从 16 位 到 64 位 。 为 每 一 位 分 配 不 同 的 地 址 是 不 切实 际 的 做 法 。 大 部 分 实际 分 配方 法 是 将 连续 

的 地 址 对 应 于 存储 器 中 连续 的 字 节 单元 。 这 是 大 多 数 现代 计算 机 中 使 用 的 分 配方 法 ， 岂 是 我 们 

在 这 本 书 中 常用 的 方法 。 按 字 节 寻 址 存储 器 就 用 于 这 种 分 配方 法 。 字 节 单 元 具有 地 址 0, 1, 2, …， 

这 样 ， 如 果 机 器 的 字 长 为 32 位 ， 那 么 连续 的 字 被 分 配 到 地 址 0, 4, 8, … 中 ， 其 中 每 个 字 包 含 四 个 
字 节 。 


2.2.2 big-endian 和 littile-endian 分 配 


就 像 在 图 2-7 中 给 出 的 那样 ， 为 字 分 配 地 址 有 两 种 方法 。 当 低 宇 节 地 址 作为 一 个 字 中 的 最 高 
有 效 字 节 (最 左边 字 节 ) 时 采用 big-endian 方 法 。 而 little-endian 方 法 用 于 相反 的 次 序 中 ， 在 这 里 
低 字 节 地 址 作为 一 个 字 中 最 低 有 效 的 字 节 (最 右边 字 节 )。 如 同 在 2.1.1 节 中 描述 的 那样 ， 字 中 的 
“最 高 有 效 ” 和 “最 低 有 效 ” 是 指 当 这 个 字 表 示 一 个 数 时 它们 在 分 配 位 中 所 占 的 权重 (以 2 为 权 )。 
Little-endian 和 big-endian 两 种 分 配 法 都 在 商业 计算 机 中 使 用 。 在 这 两 种 情况 中 ， 都 将 字 节 地 址 0， 
4,8, … 作为 存储 器 中 连续 字 的 地 址 和 用 来 说 明 存储 器 读 写字 操作 中 的 地 址 。 
在 一 个 字 中 除了 指明 字 节 地 址 排序 外 ， 还 需要 说 明 每 一 位 在 一 个 字 节 或 一 个 字 中 的 标志 。 
最 常用 的 也 是 我 们 在 这 本 书 中 采用 的 惯用 方法 在 图 2-6a 中 给 出 ， 它 是 数字 型 数据 编码 最 常用 的 排 
序 方法 。 这 种 排序 法 也 适用 于 字 节 中 位 的 标志 ， 即 从 左 到 右 是 b, be …, ho。 但 是 ， 在 有 些 计 算 机 
中 使 用 的 是 相反 的 排序 法 。 
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a) big-endian 分 配 b) little-endian} Ag 
图 2-7 字 节 和 字 的 寻 址 


2.2.3 字 的 对 齐 


在 32 位 字 长 的 情况 下 ， 如 图 2-7 所 示 ， 自 然 字 的 边界 发 生 在 地 址 0, 4, 8, … 上 。 我 们 说 这 些 字 
的 位 置 具有 对 齐 地 址 。 一 般 地 说 ， 如 果 它 们 的 开始 处 在 一 个 字 节 地 址 上 ， 这 个 地 址 又 是 在 一 个 
字 的 字 节 整 倍数 上 ， 那 么 这 些 字 在 存储 器 中 是 对 齐 的 。 因 为 实际 中 会 涉及 到 多 种 二 进 制 码 地 址 ， 
一 个 字 的 字 节 数 是 2 的 吞 次 方 ， 因 此 ， 如 果 字 长 是 16 (2 字 节 )， 对 齐 字 从 字 节 地 址 0, 2, 4 … 开始 ， 
而 如 果 一 个 字 长 是 64 (23 字 节 )， 对 齐 字 从 字 节 地 址 0, 8,16, … 开始 。 

没有 一 个 基本 原则 性 的 约定 字 不 能 从 任意 一 个 字 节 地 址 开始 。 如 果 一 个 字 可 以 从 任意 的 地 
址 开始 ， 这 些 字 就 是 不 对 齐 地 址 。 虽 然 在 大 多 数 情况 下 使 用 的 是 对 齐 的 地 址 ， 但 有 些 计 算 机 也 . 
允许 使 用 不 对 齐 地 址 的 字 。 


2.2.4 访问 数 、 字 符 和 字符 串 


一 个 数 通常 占用 一 个 字 。 在 存储 器 中 可 以 通过 指明 字 的 地 址 对 其 进行 访问 。 同 样 ， 对 于 单 
个 字符 也 可 以 通过 它们 的 字 节 地 址 进行 访问 。 

在 许多 的 应 用 中 ， 需 要 处 理 可 变 长 度 的 字符 串 。 字 符 串 的 起 始点 用 串 中 包含 的 第 一 个 字符 的 
字 节 地 址 进行 说 明 。 后 续 的 字 节 单元 中 包含 着 该 串 中 连续 的 字符 。 有 两 种 方法 可 以 说 明 该 串 的 长 度 ， 
一 个 具有 “ 串 结 尾 ”含义 的 特殊 控制 字符 可 以 用 来 作为 这 个 串 的 最 后 一 个 字符 ; 另 一 种 方法 是 使 用 


.一 个 单独 的 存储 单元 字 或 是 一 个 处 理 器 寄存 器 ， 其 中 存放 一 个 数字 用 来 表示 字符 串 的 字 节 长 度 。 


2.3 存储 器 操作 


程序 的 指令 和 数据 操作 数 都 储存 在 存储 器 中 。 要 执行 一 条 指令 ， 处 理 器 控制 电路 必须 要 将 包 
含 这 条 指令 的 单个 字 (或 多 个 字 ) 从 存储 器 传送 到 处 理 器 中 。 操 作 数 和 操作 结果 也 必须 能 够 在 存 
储 器 和 处 理 器 之 间 传 送 。 因 此 ， 有 关 存储 器 的 两 个 基本 操作 是 必须 的 ， 即 Load (或 Read、Fetch) 
和 Store (或 Wiite ) 。 


Load 操 作 是 指 对 一 个 指定 存储 单元 中 的 内 容 做 一 个 拷贝 并 将 它 传送 到 处 理 器 中 ， 存 储 器 中 





的 内 容 保持 不 变 。 在 开始 Load 操 作 时 ， 处 理 器 向 存储 器 发 送 所 期 望 得 到 单元 的 地 址 并 且 要 求 读 
取 它 的 内 容 ， 存 储 器 读 出 存储 在 那个 单元 中 的 数据 并 将 它 发 送 给 处 理 器 。 

Store 操 作 是 从 处 理 器 向 一 个 指定 的 存储 单元 中 传送 一 条 信息 ， 它 将 破坏 这 个 单元 中 原 有 的 内 
窑 。 处 理 器 向 存储 器 发 送 一 个 所 要 求 的 单元 地 址 ， 同 时 带 着 将 要 写 入 这 个 单元 中 的 数据 。 

任何 一 个 字 或 一 个 字 节 的 信息 项 都 能 够 在 处 理 器 和 存储 器 之 间 使 用 单独 的 操作 进行 传递 。 
就 像 在 第 1 章 中 描述 过 的 那样 ， 处 理 器 中 包含 有 少量 的 寄存 器 ， 每 个 寄存 器 都 能 保存 一 个 字 。 这 
些 寄存 器 可 以 作为 传送 到 存储 器 的 源 也 可 以 作为 从 存储 器 中 传送 数据 的 目的 地 。 当 传送 一 个 字 
节 时 ， 通 常 被 放 在 寄存 器 的 低位 字 节 (最 右边 ) k. 

有 关 这 些 操作 的 硬件 实现 描述 将 在 第 5 章 和 第 7 章 中 论述 。 在 本 章 中 我 们 使 用 的 是 ISA 的 观点 ， 
所 以 将 目标 集中 在 指令 和 操作 数 的 逻辑 处 理 上 。 具 体 的 硬件 部 分 ， 比 如 像 对 处 理 器 寄存 器 的 讨 
论 仅 限定 在 对 机 器 指令 和 程序 执行 情况 的 理解 范围 内 。 


2.4 指令 和 指令 序列 


由 一 个 计算 机 程序 执行 的 任务 是 由 一 些小 的 执行 步 又 序列 构成 的 ， 比 如 像 两 个 数 相 加 、 测 
试 特定 的 条 件 、 从 键盘 上 读 一 个 字符 或 是 发 送 一 个 字符 到 显示 屏 上 去 显示 等 。 一 台 计 算 机 必须 
具备 能 够 执行 以 下 四 种 类 型 操作 指令 的 能 力 : 

“ 在 存储 器 和 处 理 器 寄存 器 之 间 的 数据 传送 

* 程序 序列 和 控制 执行 

“ 输入 /输出 传送 

我 们 首先 讨论 前 两 种 指令 类 型 。 为 了 便于 讨论 ， 需 要 先 介绍 一 些 标记 符号 。 


2.4.1 寄存 器 传送 标记 


我 们 需要 描述 的 信息 在 计算 机 中 从 一 个 单元 传送 到 另 一 个 单元 。 在 这 种 传送 中 可 能 涉及 到 
的 单元 可 以 是 存储 器 中 的 单元 、 处 理 器 寄存 器 或 是 MO 子 系统 中 的 寄存 器 。 大 多 数 情况 下 ， 用 -- 
个 表示 它 的 硬件 二 进 制 地 址 的 符号 名 来 识别 其 位 置 。 例 如 ， 存 储 单元 的 地 址 名 可 能 是 LOC、 
PLACE. A. VAR2; 处 理 器 寄存 器 名 可 能 是 RO、R5; 而 IO 寄存 器 名 可 能 是 DATAIN、 
OUTSTATUS 等 。 一 个 单元 中 的 内 容 用 这 个 单元 的 名 字 外 加 两 个 方 括号 来 表示 。 因 此 表达 式 

R1 - [LOC] 

表示 存储 器 单元 LOC 中 的 内 容 被 传送 到 处 理 器 寄存 器 R1 中 。 

另 一 个 例子 是 将 寄存 器 R1 和 R2 所 包含 地 址 的 内 容 做 加 法 操作 ， 将 它们 的 和 放 到 寄存 器 R3 中 。 
这 个 动作 表示 为 : 

R3<—[R1] + [R2] 

这 种 标记 方式 就 是 所 谓 的 寄存 器 传送 标记 (RTN)。 要 注意 的 是 ， 在 RTN 表 达 式 的 右边 总 是 表示 
一 个 值 ， 而 左边 是 存放 这 个 值 的 单元 名 ， 将 用 这 个 值 覆盖 该 单元 中 原 有 的 内 容 。 


2.4.2 汇编 语言 符号 


我 们 需要 用 另 一 种 标记 符号 表示 机 器 指令 和 程序 。 为 此 ， 使 用 汇编 语言 形式 。 例 如 ， 一 条 
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如 上 所 述 的 产生 传送 操作 的 指令 ， 将 存储 单元 LOC 的 内 容 传送 到 处 理 器 寄存 器 R1 中 ， 将 使 用 这 
样 的 语句 来 说 明 : 
Move LOC,R1l 
执行 这 条 指令 后 LOC 的 内 容 不 改变 ， 但 寄存 器 R1 中 原 有 的 内 容 被 覆盖 了 。 
第 二 个 例子 处 理 器 寄存 器 R1 和 R2 中 的 两 个 数 相 加 并 将 得 到 的 和 放 到 R3 中 ， 可 以 用 汇编 语言 
的 语句 描述 为 : 


Add R1, R2, R3 
2.4.3 基本 指令 类 型 
两 个 数 相 加 的 操作 是 任何 一 台 计 算 机 都 能 够 完成 的 一 种 基本 功能 。 语 句 : 
C=A+B 


在 高 级 语言 程序 中 是 命令 计算 机 去 完成 对 A 和 B 变 量 中 的 当前 值 做 加 法 ， 并 将 得 到 的 和 放 在 第 三 
个 变量 C 中 。 当 包含 这 个 语句 的 程序 被 编译 时 ， 这 三 个 变量 A、B、C 分 配 到 了 内 存 的 不 同 单元 中 。 
我 们 将 利用 这 些 变量 名 去 引用 相应 的 内 存单 元 地 址 。 这 些 单元 的 内 容 表示 这 三 个 变量 的 值 。 因 
此 ， 以 上 高 级 语言 语句 需要 在 计算 机 中 完成 的 动作 是 ; 
C-[A] + [B] 
为 了 执行 这 个 动作 ， 存 储 单元 A 和 B 中 的 内 容 从 存储 器 中 被 取出 并 且 被 传送 到 处 理 器 中 ， 在 那里 
对 它们 进行 求 和 计算 。 这 个 结果 然后 被 传送 回 存储 器 中 并 存储 在 C 单 元 中 。 
首先 我 们 假设 这 个 动作 由 单 全 机 器 指令 完成 ， 而 且 假定 在 这 条 指令 中 包含 着 三 个 操作 数 A、 
B、C 的 存储 地 址 。 这 种 三 地 址 指令 可 以 用 符号 表示 为 : 
Add A,B, C 
操作 数 A 和 B 称 为 源 操作 数 ，C 称 为 目的 操作 数 ，Add 是 将 要 对 操作 数 执行 的 操作 。 这 种 类 型 的 指 
令 具 有 以 下 通用 格式 : 
Operation Source 1, Source 2, Destination 
(操作 源 操作 数 1， 源 操作 数 2， 目 的 操作 数 ) 
如 果 需 要 k 位 说 明 每 个 操作 数 的 内 存 地址 ， 以 上 指令 的 编码 形式 除了 需要 说 明 Add 操 作 位 以 
外 ， 还 必须 包含 用 于 编 址 目的 的 3 位 。 对 于 一 个 拥有 32 位 地 址 空间 的 现代 处 理 器 来 说 ， 三 地 址 指 
令 放 在 一 个 字 中 对 于 一 个 普通 字 长 显得 太 长 了 。 因 此 ， 需 要 有 一 种 允许 在 单个 指令 中 使 用 多 个 
字 的 格式 来 表示 这 种 类 型 的 一 条 指令 。 
一 个 可 选择 的 方法 是 使 用 简单 指令 的 一 个 序列 去 执行 同样 的 任务 ， 其 中 每 条 指令 仅 有 一 个 
或 两 个 操作 数 。 假 定 两 地 址 指令 格式 : 
Operation Source, Destination 
(操作 ” 源 操 作 数 ， 目 的 操作 数 ) 
是 可 以 使 用 的 。 这 种 类 型 的 Add 指 令 就 是 : 
Add A,B 
它 执行 的 操作 是 B ~ [A] + [B]。 当 这 个 和 被 计算 出 来 时 ， 结果 送 到 存储 器 中 并 存放 在 B 单 元 中 ， 
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替换 了 这 个 单元 中 原来 的 内 容 。 这 意味 着 操作 数 B 既 是 源 又 是 目的 操作 数 。 

一 个 单独 的 两 地 址 指令 不 能 解决 我 们 原 有 的 问题 ， 原 有 的 问题 是 对 单元 A 和 B 的 内 容 进行 相 
加 ， 并 不 破坏 这 两 个 单元 中 原 有 的 内 容 ， 并 且 将 和 放 到 单元 C 中 。 这 个 问题 可 以 用 另 一 个 将 一 个 
存储 单元 中 的 内 容 拷贝 到 另 一 个 单元 中 的 两 地 址 指令 来 解决 。 这 样 的 指令 就 是 : 

Move B,C 
这 里 执行 C~[B] 的 操作 ,保留 单元 B 中 的 内 容 不 变 。 操 作 “Move” 在 这 里 并 不 合适 ， 它 其 实 应 
该 是 “Copy" 。 但 是 ， 这 个 指令 名 已 深 深 地 被 印 在 计算 机 术语 表 中 了 。Ce-~ [A] + [B] 的 操作 现在 
可 以 用 两 条 指令 序列 来 完成 : 

Move B,C 

Add A,C 


在 以 上 给 出 的 所 有 指令 中 ， 首 先 指明 的 是 源 操 作 数 ， 接 着 是 目的 操作 数 。 这 种 顺序 在 许多 
计算 机 中 被 用 于 汇编 语言 对 机 器 指令 的 表示 中 。 但 也 有 很 多 计算 机 中 使 用 的 源 和 目的 操作 数 的 
顺序 是 相反 的 。 在 第 3 章 中 我 们 将 会 看 到 这 两 种 表示 法 的 例子 。 不 幸 的 是 ， 在 这 个 问题 上 、 没 有 
一 个 明确 的 规定 被 所 有 的 制造 商 所 采用 。 事 实 上 ， 即 使 是 对 于 一 台 给 定 的 计算 机 ， 它 的 汇编 语 
言 也 可 能 对 于 不 同 的 指令 采用 不 同 的 顺序 。 在 本 章 中 ， 我 们 将 继续 使 用 源 操作 数 在 前 的 表达 方 
式 进行 描述 。 

我 们 已 定义 了 三 地 址 和 两 地 址 指令 。 但 是 ， 即 便 是 两 地 址 指令 也 许 都 不 能 被 正确 地 放 入 到 
一 个 一 般 字 长 和 地 址 大 小 表示 的 字 中 。 还 有 一 种 可 能 是 ， 有 一 些 机 器 指令 中 只 指明 了 一 个 内 存 
操作 数 。 当 需要 第 二 个 操作 数 时 ， 比 如 在 一 个 Add 指 令 中 ， 它 认为 该 操作 数 隐 含 在 一 个 特定 的 单 
元 中 。 一 个 叫做 累加 器 的 处 理 器 寄存 器 可 以 用 来 完成 此 目的 。 因 此 ， 单 地 址 指令 : 

Add A 
的 含义 如 下 : 将 存储 单元 A 中 的 内 容 加 到 累加 寄存 器 中 ， 然 后 将 它们 的 和 放 回 到 累加 寄存 器 中 。 
我 们 再 来 介绍 单 地 址 指令 

Load A 
和 

Store A 
Lead 指令 将 存储 单元 A 中 的 内 容 持 贝 到 累加 器 中 ， 而 Store 指 令 是 将 累加 器 的 内 容 拷贝 到 存储 单元 
A 中 。 只 使 用 单 地 址 指令 ，C~[ A]+[B ] 操 作 可 以 被 以 下 指令 序列 来 完成 : 

Load A 

Add B 

Store C 


注意 在 指令 中 指明 的 操作 数 可 以 是 源 也 可 以 是 目的 ， 具体 依赖 于 这 条 指令 的 内 容 。 在 Load 指 令 
中 ,地 址 A 指明 的 是 源 操作 数 ， 而 目标 单元 即 累 加 器 是 隐 含 的 。 另 一 一 方面 ，C 在 Store 指 令 中 代表 
着 目标 单元 ， 而 源 即 累加 器 是 隐 含 的 。 

早期 的 一 些 计 算 机 是 围绕 着 一 个 单独 的 累加 器 结构 设计 的 。 大 部 分 现代 计算 机 设 有 大 量 的 
通用 处 理 器 寄存 器 一 -通常 有 8 到 32 个 ， 在 有 些 情况 下 数目 会 更 多 。 对 这 些 寄存 器 中 数据 的 访问 
比 对 存储 在 内 存单 元 中 数据 的 访问 要 快 得 多 ， 因 为 寄存 器 是 包含 在 处 理 器 内 部 的 。 由 于 寄存 器 
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的 数量 相对 较 少 ， 只 需要 用 少量 的 位 数 来 指明 是 哪个 寄存 器 参与 了 运算 。 例 如 对 于 32 个 寄存 器 
来 说 ， 只 需要 5 位 地 址 。 它 比 用 给 出 一 个 在 内 存单 元 中 的 地 址 使 用 的 位 数 要 少 得 多 。 由 于 可 以 做 
到 快速 处 理 并 且 能 缩短 指令 执行 ， 寄 存 器 常 被 用 来 存放 处 理 器 正在 处 理 过 程 中 的 临时 数据 。 
假设 Ri 表示 一 个 通用 寄存 器 ， 指 令 : 

Load A, Ri 

Store Ri, A 
和 

Add A,Ri 


是 对 Load、Store 和 Add 指 令 对 于 单独 累加 器 情况 的 概括 说 明 ， 这 里 寄存 器 Ri 完成 的 是 累加 器 的 功 
能 。 即 便 在 这 些 情况 下 ， 当 在 一 个 指令 中 直接 说 明 惟 一 的 存储 地 址 时 ， 这 条 指令 也 有 可 能 不 能 
正常 地 放 到 一 个 字 中 。 
当 一 个 处 理 器 有 若干 个 通用 寄存 器 时 ， 许 多 指令 所 用 到 的 惟一 操作 数 被 放 在 寄存 器 中 。 事 
实 上 ,在 许多 现代 处 理 嚣 中， 计算 能 够 直接 在 处 理 器 寄存 器 中 保存 的 数据 上 执行 。 例 如 指令 : 
Add Ri, Rj 
或 
Add Ri, Rj, Rk 
都 是 这 种 类 型 的 指令 。 在 这 两 个 指令 中 ， 源 操作 数 是 寄存 器 Ri 和 Rj 的 内 容 。 在 第 一 条 指令 中 ，Rj 
还 当 作 目 的 寄存 器 ,然而 在 第 二 条 指令 中 ， 第 三 个 寄存 器 Rk 当 作 目 的 寄存 器 。 在 这 种 指令 中 ， 
因为 只 有 寄存 器 的 名 字 包 含 在 指令 中 ， 所 以 可 以 被 正常 地 放 入 到 一 个 字 中 。 
通常 需要 在 两 个 不 同 的 单元 中 传递 数据 ， 使 用 以 下 指令 可 以 达到 这 一 目的 : 
Move Source, Destination 


它 将 源 操作 数 中 的 内 容 持 贝 到 目标 中 。 当 数据 传送 到 处 理 器 的 寄存 器 中 或 是 从 寄存 器 中 移出 时 ， 
可 以 使 用 Move 指 令 而 不 是 使 用 Load 或 Store 指 令 ， 因 为 源 操作 数 和 目的 操作 数 的 顺序 决定 了 所 需 
要 的 是 哪 种 操作 。 因 此 ， 


Move A,Ri 
相同 于 

Load A, Ri 
而 

Move Ri, A 
相同 于 

Store Ri, A 


在 本 章 中 我 们 将 用 Move 指 令 代替 Load 或 Store 命 令 。 
对 于 那些 允许 算术 运算 可 以 将 操作 数 只 放 在 处 理 器 寄存 器 中 的 处 理 器 ， 作 业 C = A + B 可 以 
用 以 下 的 指令 序列 完成 : 
Move A,Ri 
Move B, Rj 





Add Ri,Rj 
Move RJ, C 
对 于 只 有 -- 个 操作 数 在 存储 器 中 而 其 他 的 操作 数 必须 在 寄存 器 中 的 处 理 器 ， 满 足 这 个 作业 
需要 的 指令 序列 应 该 为 
Move A,Ri 
Add B,Ri 
Move Ri,C 
一 个 给 定 作业 执行 速度 依赖 于 从 存储 器 到 处 理 器 之 间 传 递 指令 和 传递 这 些 指令 需 访 问 的 相 
关 操 作 数 的 时 间 。 存 储 器 之 间 传 送 要 比 在 处 理 器 内 部 传送 慢 得 多 。 因 此 ， 当 若干 个 运算 被 连续 
执行 ， 而 且 它 们 的 数据 在 处 理 器 寄存 器 中 ， 从 而 不 需要 将 数据 拷贝 到 存储 器 或 从 存储 器 中 读 取 
数据 时 ， 它 的 运算 速度 将 会 大 大 提高 。 当 编译 程序 从 高 级 语言 生成 机 器 语言 程序 时 ， 控 制 数据 
在 存储 器 和 处 理 器 寄存 器 之 间 来 回 传送 的 频率 是 十 分 重要 的 。 
我 们 已 讨论 过 三 、 商 和 单 地 址 指令 。 但 也 有 这 种 可 能 ， 指 令 中 使 用 的 所 有 操作 数 的 位 置 都 
是 隐 含 定义 的 。 这 种 指令 可 以 在 那些 将 操作 数 存储 在 下 推 术 结构 的 机 器 中 找到 。 在 这 种 情况 下 ， 
这 种 指令 称 为 零 地 址 指令 。 有 关 下 推 栈 的 概念 将 在 2.8 节 中 介绍 ， 而 使 用 这 种 方法 的 计算 机 将 在 
第 11 章 中 讨论 。 


2.4.4 指令 执行 和 线性 序列 
在 前 面 的 指令 格式 讨论 中 ， 我 们 使 用 任务 C~[A] + [B] 作 了 说 明 。 图 2-8 给 出 了 完成 这 个 任务 
的 程序 段 ， 当 它 存放 在 计算 机 存储 器 中 的 情况 。 我 们 已 经 假定 该 计算 机 允许 每 条 指令 有 一 个 存 


放 在 存储 器 中 的 操作 数 并 且 该 计算 机 有 一 定数 量 的 处 理 器 寄存 器 。 假 定 该 机 字 长 为 32 位 并 且 存 
储 器 是 按 字 节 可 寻 址 的 。 程 序 中 的 三 条 指令 放 在 连续 的 字 单元 中 ， 起 始 单元 是 f。 以 后 的 每 条 指 


地 址 内 容 





从 这 里 开始 执行 —= i Move A,R0 u 
Add BRO 


Move RO,C 


3 指令 程序 段 





| 
一 一 
一 一 一 该 程序 的 数据 
c = C U 
-一 一 


图 2-8 一 个 完成 C~ [A] + [B] 的 程 
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令 是 4 字 节 长 ， 第 二 和 第 三 条 指令 的 起 始 地 址 为 ;+ 4 和 ji+8。 为 了 简单 起 见 ， 还 假定 所 有 内 存 地 
址 都 能 够 在 一 个 单字 指令 中 直接 说 明 ， 虽 然 这 对 于 当前 的 处 理 器 的 地 址 空间 范围 和 字 长 来 说 ， 
通常 是 不 可 能 的 。 

让 我 们 来 考虑 这 个 程序 将 如 何 执 行 。 处 理 器 中 包含 一 个 称 为 程序 计数 器 (PC) 的 寄存 器 ， 
它 保 存 着 下 一 步 将 费 执 行 指令 的 地 址 。 当 开始 执行 一 个 程序 时 ， 它 的 第 一 条 指令 地 址 (在 本 例 
中 为 i) 必须 放 入 PC 中 。 然 后 处 理 器 的 控制 电路 利用 PC 中 的 这 个 信息 ， 一 次 一 个 地 按照 递增 地 址 
的 顺序 获取 并 执行 指令 。 这 种 执行 方式 叫做 线性 序列 。 在 每 条 指令 执行 时 ，PC 每 次 用 4 做 递增 值 
以 指向 下 一 条 指令 。 这 样 当 i+ 8 位 置 上 的 Move 指 令 被 执行 后 ，PC 中 包含 的 值 是 i+ 12， 它 是 下 
一 个 程序 段 的 第 一 条 指令 的 地 址 。 

执行 一 条 给 定 指令 可 以 分 成 两 个 阶段 ， 第 一 个 叫做 取 指 令 阶段 中 ， 根 据 PC 提 供 的 地 址 从 存 
储 单元 中 获取 该 指令 。 这 条 指令 被 放 入 到 处 理 器 的 指令 寄存 器 (IR) 中 。 在 第 二 个 叫做 指令 执 
行 的 阶段 开始 时 ， 对 巩 中 的 指令 进行 检查 以 确定 将 要 执行 哪 种 操作 。 这 个 被 指明 的 操作 然后 被 
处 理 器 执行 。 这 个 执行 过 程 通常 涉及 到 从 存储 器 或 处 理 器 寄存 器 中 提取 操作 数 ， 执 行 一 个 算术 
或 逻辑 运算 ， 然 后 将 结果 存放 到 目标 单元 中 。 在 这 两 个 过 程 中 的 某 个 点 上 ，PC 的 内 容 被 递增 使 
它 指向 下 一 条 指令 。 当 一 条 指令 的 执行 阶段 完成 时 ，PC 中 包含 着 下 一 条 指令 的 地 址 ， 并 且 一 个 
新 的 读 取 指 令 阶 段 又 可 以 开始 了 。 在 大 多 数 处 理 器 中 ,执行 阶段 本 身 又 被 划分 成 了 一 些 相应 的 
取 操 作 数 、 执 行 运算 以 及 储存 结果 的 不 同 阶段 。 


2.4.5 转移 


考虑 对 一 个 有 n 个 数 的 列表 相 加 的 任务 。 图 2-9 中 的 程序 轮廓 是 对 图 2-8 中 程序 的 一 个 概括 。 
包含 有 n 个 数 的 存储 单元 的 地 址 用 符号 NUM1、NUM2、…、NUMn 给 出 、 并 且 使 用 一 个 单独 的 
Add 指 令 将 每 个 数 累 加 到 寄存 器 RO 中 ， 当 所 有 的 数 加 完 以 后 ， 结 果 被 存放 在 存储 单元 SUM 中 。 
代替 使 用 一 长 串 的 Add 指 令 ， 可 将 一 个 单独 的 Add 指 令 放 在 一 个 循环 程序 中 ， 就 像 在 图 2-10 
中 看 到 的 那样 。 这 个 循环 是 一 个 顺序 指令 序列 ， 根 据 需 要 多 次 被 执行 。 它 的 开始 点 在 LOOP 单 元 
处 ， 结 束 点 在 指令 Branch >0 处 。 每 经 过 一 轮 这 个 循环 时 ， 列 表 中 下 一 个 元 素 的 地 址 就 被 确定 下 
来 ， 然 后 这 个 元 素 被 提取 出 来 并 加 到 RO 中 。 操 作 数 的 地 址 可 以 用 多 种 方式 指出 ， 这 些 将 在 2.5 节 
中 介绍 。 这 里 ， 我 们 把 注意 力 集中 在 如 何 创建 并 控制 程序 的 循环 上 。 
假设 这 个 列表 中 元 素 的 数量 为 +，n 被 储存 在 内 存单 元 N 中 ， 如 下 图 所 示 。 寄 存 器 R1 当 作 一 个 
在 循环 体内 部 ， 指 令 
Decrement R1 
每 当 通 过 一 次 该 循环 时 对 R1 的 内 容 减 1 (类 似 的 这 种 操作 是 执行 一 条 增值 指令 ， 它 对 操作 数 每 次 
加 1)。 只 要 递减 操作 的 结果 是 大 于 0 的 ， 就 重复 执行 这 个 循环 。 
现在 我 们 来 介绍 转移 指令 。 这 类 指令 将 一 个 新 的 值 加 载 到 程序 计数 器 中 ， 因 此 ， 处 理 器 按 
这 个 新 地 址 〈 该 地 址 称 为 转移 目标 ) 获取 并 执行 这 个 指令 ， 替 代 了 按 顺 序 紧 挨 着 转移 指令 的 那 
个 地 址 单元 中 的 指令 执行 。 条 件 转移 指令 只 有 在 给 出 的 条 件 满 足 时 才 产 生 一 个 转移 。 如 果 条 件 
不 满足 ，PC 按 正常 的 方式 进行 增值 ， 连 续 地 址 顺序 的 下 一 条 指令 被 提取 并 被 执行 。 
在 图 2-10 的 程序 中 ， 指 令 
Branch >0 LOOP 





(如 果 大 于 0 就 转移 ) 是 一 个 条 件 转移 指令 ， 如 果 前 一 条 指令 的 执行 结果 是 大 于 0 的 ， 也 就 是 寄存 
器 Ri 中 的 递减 值 是 大 于 0 的 ， 就 产生 一 个 转 去 执行 LOOP 单 元 中 指令 的 转移 指令 。 这 意味 着 只 要 
在 列表 中 有 元 素 还 可 以 被 加 到 R0 中 ， 这 个 循环 是 要 重复 执行 的 。 在 n 遍 循环 过 后 ， 递 减 指令 产生 
了 一 个 0 值 ， 因 此 转移 不 再 发 生 。 替 代 它 的 是 Move 指 令 被 提取 并 被 执行 。 它 将 最 后 的 结果 从 RO 
中 移 到 内 存单 元 SUM 中 。 


í 


uraman 
Move N,R1 i 
ON | 


Move NUMIRO | i 
Wasa | Clear RO | 
| — 
| 


i+4 L x Add NUM2 RO 
| Add NUM3RO | 






















LOOP i 
三 定 下 一 个 数 的 地 十 











, ; 并 将 下 一 个 数 加 到 RO “| 
循环 程序 | | 
$o aoeoteoseernreotudeoabotimecotoonteoceooneertrmto eon 
: : Decrement R1 i 
i+4n-4 Add NUMn,RO E 
i+4n Move RO,SUM 
SUM 
SUM 
N 
NUM1 NUMI 
NUM2 NUM2 
NUMn Nume 一 
图 2-9 一 个 用 于 累加 "个 数 的 顺序 程序 图 2-10 用 一 个 循环 完成 x 个 数 相 加 


这 种 首先 测试 条 件 然后 从 设置 的 选择 中 选择 一 种 方式 继续 执行 的 计算 能 力 比 仅仅 完成 循环 
控制 的 方式 有 着 更 多 的 应 用 价值 。 这 种 能 力 在 所 有 计算 机 指令 系统 中 都 可 以 找到 ， 并 且 它 对 于 
大 多 数 重要 任务 的 程序 设计 也 是 必须 的 。 


2.4.6 条 件 码 
为 了 随后 的 条 件 转移 指令 的 使 用 ， 处 理 器 要 保存 有 关 各 种 操作 执行 结果 的 过 程 信息 。 为 了 


标志 通常 会 被 诗集 在 一 起 形成 一 个 特殊 的 处 理 器 寄存 器 ， 该 寄存 器 叫做 条 件 码 寄存 器 或 是 状态 
寄存 器 。 每 个 单独 的 条 件 码 标志 可 以 根据 操作 执行 结果 ， 被 设置 为 1 或 清除 成 0。 

四 种 常用 的 标志 是 : 

N (人 负数) 如 果 结 果 是 负数 置 成 1， 否 则 清除 为 0 

Z ( 零 ) ”如果 结果 是 0 置 成 1; 否则 清除 为 0 

V (溢出 ) 如 果 运 算 发 生 溢出 置 成 1; 否则 清除 为 0 

C (进位 ) ”如 果 运 算 结 果 有 一 个 进位 输出 置 成 1; 否则 清除 为 0 
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N 和 Z 标 志 表 示 算 术 或 逻辑 运算 的 结果 是 否 为 负数 或 0。 N 和 Z 标 志 还 会 受 传递 数据 指令 的 影 
响 ， 例 如 像 Move、Load 或 Store 这 样 的 指令 。 它 有 可 能 对 以 后 的 条 件 转移 指令 产生 影响 ， 可 以 基 
于 被 传送 的 操作 数 的 符号 和 值 去 产生 一 个 转移 。 有 些 计 算 机 还 提供 一 条 特殊 的 Test 指 令 ， 它 检查 
某 个 寄存 器 或 某 个 存储 器 中 的 值 ， 然 后 根据 检查 情况 置 位 或 清除 N 和 Z 的 相应 标志 。 

V 标 志 表 示 溢 出 是 否 发 生 。 就 像 在 2.1.4 节 中 解释 的 那样 ， 当 一 个 算术 运算 的 结果 超出 了 操作 
数 可 使 用 位 数 能 够 表示 值 的 范围 时 ， 就 产生 了 溢出 。 处 理 器 对 V 标 志 进 行 置 位 ， 使 程序 员 可 以 去 
测试 是 否 已 经 发 人生 了 溢出 并 能 够 转移 到 这 个 问题 的 正确 执行 的 程序 段 中 。 像 BranchIfOverflow 这 
样 的 指令 就 是 为 这 一 目的 提供 的 。 还 有 ， 就 像 我 们 将 在 第 4 章 中 看 到 的 那样 ，V 位 被 置 位 可 能 会 
引起 一 个 程序 自动 产生 中 断 ， 并 且 由 操作 系统 决定 下 一 步 将 要 做 什么 。 

如 果 在 算术 运算 中 从 最 高 有 效 位 产生 一 个 进位 ，C 标 志 就 被 置 成 1。 这 个 标志 使 得 在 执行 算术 
运算 中 的 操作 数 可 以 比 处 理 器 的 有 效 字 长 还 要 长 。 这 种 操作 可 以 用 在 多 精度 的 算术 运算 中 ， 这 些 
将 在 第 6 章 讨论 。 

在 2.4.5 节 中 讨论 的 指令 Branch > 0 是 一 个 测试 单个 或 多 个 条 件 标志 的 转移 指令 例子 。 如 果 被 
测试 的 值 既 不 为 负数 又 不 等 于 零 ， 就 产生 一 个 转移 。 就 是 说 ， 如 果 N 和 Z 都 不 为 1， 就 产生 一 个 转 
移 。 还 会 提供 许多 其 他 的 条 件 转移 指令 以 满足 各 种 条 件 的 测试 。 这 些 条 件 是 作为 与 条 件 标志 码 
有 关 的 逻辑 表达 式 给 出 的 。 

在 一 些 计算 机 中 ， 条 件 码 标志 自动 地 受 执 行 算术 或 逻辑 运算 指令 的 影响 。 然 而 ， 这 并 不 是 
普 过 的 情况 。 例 如 ， 许 多 计算 机 中 有 两 个 版 本 的 Add 指 令 。 一 种 版 本 Add 不 影响 标志 位 ; 而 另 一 
种 版 本 AddSetCC 就 对 标志 位 造成 影响 。 这 给 程序 员 和 编译 程序 在 对 程序 做 流水 线 执行 的 预 处 理 
时 提供 了 更 多 的 灵活 性 ， 流 水 线 执行 我 们 将 在 第 8 章 中 讨论 。 


2.4.7 生成 存储 器 地 址 


让 我 们 回 到 图 2-10 中 ，LOOP 指 令 块 的 目的 是 在 每 次 经 过 循环 时 ， 从 列表 中 加 一 个 不 同 的 数 。 
因此 ， 在 每 次 循环 中 ， 这 个 块 中 的 Add 指 令 必须 访问 一 个 不 同 的 地 址 。 怎 样 来 指明 这 个 地 址 呢 ? 
内 存 操作 数 地 址 无 法 在 循环 中 用 一 个 单独 的 Add 指 令 直 接 给 出 。 否 则 ， 它 将 需要 在 每 次 的 循环 中 
进行 修正 。 作 为 一 种 可 能 情况 ， 假 设 处 理 器 寄存 器 Ri 用 来 作为 保存 一 个 操作 数 的 内 存 地 址 。 如 果 
在 循环 之 前 ，Ri 用 NUM1 作 为 初始 装载 地 址 ， 以 后 每 通过 一 次 循环 后 用 4 进行 递增 ， 就 可 以 提供 
所 需要 的 地 址 了 。 

在 这 种 以 及 其 他 很 多 类 似 的 情况 下 ， 更 多 的 是 根据 需要 用 灵活 方式 去 指明 一 个 操作 数 的 地 
址 。 一 个 计算 机 的 指令 系统 通常 提供 了 多 种 这 样 的 方法 ， 它 们 称 为 姓 址 方式 。 尽管 计算 机 之 间 
的 具体 情况 不 同 ， 但 是 其 基本 概念 是 相同 的 。 我 们 在 下 一 节 中 将 讨论 这 些 问 题 。 


2.5 FHEAR 


现在 我 们 已 经 看 到 了 一 些 汇编 语言 程序 的 简单 例子 。 一 般 来 说 ， 一 个 程序 是 对 储存 在 计算 
机 存储 器 中 的 数据 进行 操作 的 ， 这 些 数据 可 以 用 多 种 方式 组 织 。 如 果 想 要 保留 学 生 姓 名 ， 我 们 
可 以 将 它们 写 在 一 个 表 中 。 如 果 想 将 每 个 名 字 与 一 些 信息 联系 起 来 ， 比 如 记录 电话 号 码 或 各 门 
课程 的 分 数 ， 可 以 用 表格 的 形式 构成 这 些 信息 。 程 序 员 使 用 叫做 数据 结构 的 组 织 结构 表示 用 于 
计算 中 的 数据 。 这 些 数据 结构 包括 表 、 链 表 、 数 组 、 队 列 等 。 
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程序 通常 是 用 高 级 语言 编写 的 ， 在 高 级 语言 中 程序 员 可 以 使 用 常数 、 局 部 和 全 局 变量 、 指 
针 和 数组 。 当 把 一 个 高 级 语言 程序 翻译 成 汇编 语言 时 ， 编 译 程序 必须 能 够 使 这 些 结构 有 效 地 利 
用 一 些 便利 条 件 ， 而 这 些 便利 条 件 是 在 将 要 运行 该 程序 的 计算 机 指令 系统 中 已 经 提供 的 。 在 一 
条 指令 中 具体 指明 操作 数位 置 的 不 同方 法 称 为 姓 址 方式 。 在 这 一 节 中 ， 我 们 给 出 现代 处 理 器 中 
最 主要 的 寻 址 方式 ， 在 表 2-1 中 给 出 了 一 个 简要 的 描述 。 


表 2-1 通用 的 寻 址 方式 





名 R 汇编 语法 寻 址 功能 
VAi #Value 操作 数 = Value 
寄存 器 Ri EA = Ri 
绝对 (直接) LOC EA = LOC 
间接 (Ri) EA = [Ri] 
(LOC) EA = [LOC] 
A hi: X (Ri EA =[Ri] +X 
EE hht (Ri, Rp) EA = [Ri] + [Rj] 
带 变 址 和 偏 移 基 的 基 址 X (Ri, Rp) EA = [R;] + [Rj+X 
相对 X (PC) EA =[PC] +X 
EEE 84 (RD+ EA = [Rj 
递增 Ri 
自动 递减 - (R) 递减 Ri 
EA=[Ri] 
EA = 有 效 地 址 
Value = 有 符号 数 


2.5.1 变量 和 常数 的 实现 


变量 和 常数 是 最 简单 的 数据 类 型 ， 并 且 几乎 在 任何 一 个 计算 机 程序 中 都 会 存在 。 在 汇编 语 
言 中 ， 一 个 变量 用 分 配 保存 该 变量 值 的 寄存 器 或 是 内 存单 元 来 表示 。 因 此 ， 这 个 值 可 以 根据 需 
要 使 用 适当 的 指令 来 改变 。 

在 2.4 节 的 程序 中 只 和 使 用 了 两 种 寻 址 方式 去 访问 变量 。 我 们 通过 指明 寄存 器 的 名 称 或 是 操作 
数 被 装 入 的 内 存 地 址 单元 地 址 来 访问 操作 数 。 这 两 种 方式 的 具体 定义 是 : 

寄存 器 方式 一 一 操作 数 是 处 理 器 寄存 器 中 的 内 容 ; 在 指令 中 给 出 寄存 器 的 名 称 (地 址 )。 

绝对 方式 一 一 操作 数 在 一 个 存储 器 单元 中 ; 指令 中 明确 地 给 出 了 这 个 单元 的 地 址 (在 有 些 汇 
编 语言 中 ， 这 种 方式 叫做 直接 方式 )。 


指令 








Move LOC, R2 
使 用 了 这 两 种 方式 。 处 理 器 寄存 器 当 作 临 时 储存 单元 ， 这 时 在 寄存 器 中 的 数据 使 用 寄存 器 方式 
进行 访问 。 绝 对 方式 在 程序 中 可 以 表示 全 局 变量 。 例 如 在 高 级 语言 程序 中 有 这 样 一 个 声明 : 
Integer A,B 
它 将 导致 编译 程序 为 变量 A 和 B 分 别 分 配 一 个 内 存单 元 。 每 当 它们 在 以 后 的 程序 中 被 引用 时 ， 编 
译 程序 就 产生 绝对 方式 去 访问 这 些 变量 的 汇编 语言 指令 。 
下 面 让 我 们 来 考虑 常数 的 表示 方法 。 地 址 和 数据 常数 在 汇编 语言 中 可 以 用 立即 方式 来 表示 。 
立即 方式 一 一 操作 数 在 指令 中 被 明确 地 给 出 。 
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例如 指令 
Move 200 immediate, RO 
表示 将 数值 200 存 人 寄存 器 RO0 中 。 显 然 ， 立 即 方式 只 是 用 于 指明 一 个 源 操作 数值 的 。 使 用 下 标 来 
说 明 立 即 方式 在 汇编 语言 中 是 不 合适 的 。 常用 的 约定 是 在 这 个 值 的 前 面 使 用 一 个 井 字符 号 (#) 
来 说 明 这 个 值 是 作为 立即 操作 数 使 用 的 。 因 此 ， 我 们 用 以 下 方式 写 出 上 一 条 指令 : 
Move #200, RO 
常数 值 经 常 在 高 级 语言 程序 中 使 用 。 例 如 语句 : 
A=B+6 
就 包含 常数 6。 假 定 A 和 B 已 经 在 前 面 声明 成 变量 ， 并 且 可 以 使 用 绝对 方式 进行 访问 ， 这 条 语句 可 
以 被 编译 成 以 下 的 语句 : 
Move B, Ri 
Add #6,R1 
Move R1,A 


在 汇编 语言 中 常数 也 可 以 用 来 作为 一 个 计数 器 的 增 量 、 测 试 一 些 匹 配 位 等 。 
2.5.2 间接 和 指针 


在 下 面 的 寻 址 方式 中 ， 指 令 没 有 明确 地 给 出 操作 数 或 是 地 址 。 赫 代 的 方式 是 ， 提 供 了 可 以 
确定 操作 数 的 内 存 地 址 的 信息 。 我 们 把 这 种 地 址 称 为 操作 数 的 有 效 地 址 (EA). 

间接 方式 一 一 操作 数 的 有 效 地 址 是 一 个 寄存 器 或 存储 单元 中 的 内 容 ， 而 这 个 寄存 器 或 内 存单 
元 的 地 址 在 指令 中 给 出 。 

我 们 用 在 指令 中 使 用 圆 括号 的 方法 来 表示 间接 寻 址 ， 在 圆 括号 中 放置 寄存 器 的 名 称 或 是 内 
存 地 址 ， 如 在 图 2-11 和 表 2-1 中 给 出 的 举例 那样 。 

为 了 执行 图 2-11a 中 的 Add 指 令 ， 处 理 器 将 B 值 ( 它 在 寄存 器 R1 中 ) 作为 操作 数 的 有 效 地址 。 
它 需要 一 个 读 操作 从 内 存 中 读 出 单元 B 中 的 内 容 。 这 个 读 出 的 值 是 所 需要 的 操作 数 ， 处 理 器 将 它 
加 到 寄存 器 RO 的 内 容 中 。 间 接 寻 址 也 可 以 通过 一 个 存储 单元 完成 ， 就 像 在 图 2-11b 中 表示 的 那样 。 
在 这 种 情况 下 ， 处 理 器 首先 读 取 存储 单元 A 中 的 内 容 ， 然 后 使 用 B 值 作为 地 址 ， 完 成 第 二 个 读 操 
作 去 获取 该 操作 数 。 


Add (Ri RO 








Add (A)RO 






B | | AÍ | | 
Ri | B T) 8 ,| 操作 数 ” x 
a) 通过 -个 通用 寄存 加 b) 通过 一 个 存储 器 单元 


图 2-11 间接 录 址 
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包含 一 个 操作 数 地 址 的 寄存 器 或 内 存单 元 称 为 指针 。 间 接 方式 和 指针 的 使 用 在 程序 设计 中 
是 一 个 重要 和 强 有 力 的 概念 。 考 虑 一 个 类 似 于 寻找 宝物 的 问题 :在 寻找 指令 中 可 能 告诉 你 要 去 
寻找 -个 房子 的 地 址 ， 而 不 是 所 要 寻找 的 宝物 的 地 址 ;在 房子 中 你 找到 了 一 个 提示 信息 ， 它 给 
了 你 另 一 个 地 址 ， 在 这 个 地 址 中 你 将 会 找到 宝物 。 随 着 提示 信息 的 变化 ， 宝 物 的 位 置 可 以 被 改 
F, 但 是 寻找 宝物 的 指令 是 相同 的 。 改 变 提 示 信 息 等 于 在 计算 机 程序 中 改变 一 个 指针 的 内 容 。 
例如 ， 在 图 2-11 中 随 着 寄存 器 R1 或 单元 A 中 内 容 的 改变 ， 同 样 的 Add 指 令 取 到 了 不 同 的 操作 数 ， 
并 将 它们 加 到 寄存 器 RO 中 。 
现在 让 我 们 回 到 图 2-10 对 于 一 个 列表 中 的 数字 做 加 法 的 程序 中 。 间 接 寻 址 可 以 用 来 访问 表 中 

连续 的 数据 ， 程 序 的 修改 结果 在 图 2-12 的 程序 中 给 出 。 寄 存 器 R2 被 当 作 列 表 中 数字 的 指针 ， 操 
作 数 通过 R2 间 接地 被 访问 。 程 序 的 初始 化 部 分 从 存储 单元 N 中 将 计数 器 的 值 加 载 到 R1 中 ， 并 且 
使 用 立即 寻 址 方式 将 地 址 值 NUM1 放 置 到 R2 中 ， 这 个 地 址 是 列表 中 第 一 个 数 的 量 址 。 然 后 将 R0 
的 内 容 清 为 0。 图 2-12 中 循环 体 里 的 前 两 条 指令 执行 以 LOOP 开 始 的 未 明确 指明 的 指令 块 ， 如 图 2-10 
所 示 。 第 一 次 通过 循环 时 ， 指 令 

Add (R2), RO 
从 单元 NUM1 获 取 操作 数 ， 并 把 它 加 到 R0 中 。 第 二 条 Add 指 令 将 指针 R2 的 内 容 加 上 4， 这 样 在 通 
过 第 二 遍 循环 执行 以 上 指令 时 ，R2 中 将 包含 着 地 址 值 NUM2。 再 来 看 C 语 言语 句 

A=*B 

这 里 B 是 一 个 指针 变量 。 这 个 语句 可 以 被 编译 成 : 

Move B,Ri 

Move” (R1), A 
通过 存储 器 使 用 间接 寻 址 ， 用 下 面 的 指令 能 达到 同样 的 效果 : 

Move (B), A 
尽管 表面 上 看 很 简单 ， 通 过 存储 器 的 间接 寻 址 方式 已 经 被 证 明 是 一 种 用 途 有 限 的 寻 址 方式 ， 在 
现代 计算 机 中 已 不 常见 了 。 在 第 8 章 中 我 们 将 看 到 这 种 指令 ， 它 需要 两 次 访问 存储 器 去 得 到 一 个 
操作 数 ， 不 能 很 好 地 适应 流水 线 技术 的 执行 。 


Move N,RI 
Move #NUMI,R2 初始 化 
Clear RO 


Add (R2),R0 
Add 

Decrement 

Branch>0 

Move 





图 2-12 在 图 2-10 中 的 程序 中 使 用 间接 寻 址 方式 


通过 寄存 器 进行 间接 寻 址 已 经 被 广泛 应 用 。 图 2-12 中 的 程序 展示 了 它 所 提供 的 灵活 性 。 另 外 ， 
， 当 绝对 寻 址 无 法 使 用 时 ， 通 过 寄存 器 的 间接 寻 址 方式 使 它 能 够 用 第 一 个 装 入 到 寄存 器 中 的 操作 
数 地 址 去 访问 全 局 变量 。 
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25.3 变 址 和 数组 


下 一 个 我 们 将 要 讨论 的 寻 址 方式 提供 了 访问 操作 数 不 同 方式 的 灵活 性 。 它 对 于 列表 和 数组 
的 处 理 很 有 用 。 

变 址 方式 一 -操作 数 有 效 地 址 是 由 对 一 个 寄存 器 中 的 内 容 加 上 一 个 常数 值 而 生成 的 。 

使 用 的 寄存 器 可 以 是 专门 为 这 一 目标 设立 的 专用 寄存 器 ， 更 通用 的 方式 是 ， 它 可 以 是 处 理 
器 中 设置 的 任何 一 个 通用 寄存 器 。 无 论 是 哪 种 情况 ， 它 都 被 称 为 变 址 寄 看 器。 我 们 表示 变 址 方 
式 的 符号 是 : 

X (Ri) 
这 里 X 表 示 在 指令 中 保存 的 常数 值 ， 而 Ri 是 相关 寄存 器 的 名 字 。 该 操作 数 的 有 效 地 址 用 下 面 的 式 
子 给 出 : 
EA=X+[Ri] 

变 址 寄存 器 的 内 容 在 生成 有 效 地 址 的 过 程 中 不 能 被 改变 。 

在 汇编 语言 程序 中 ， 常 数 X 可 以 用 直接 说 明 的 数字 或 用 一 个 表示 数字 值 的 符号 名 给 出 。 在 这 
种 方法 中 一 个 符号 名 是 与 一 个 特定 的 数字 值 相关 的 ， 这 将 在 2.6 节 中 讨论 。 当 指令 被 转换 成 机 器 
码 时 ， 常 数 X 作 为 指令 的 一 部 分 被 给 出 并 且 通 常用 比 计算 机 的 字 长 要 少 的 位 数 来 表示 。 因 为 X 是 
一 个 有 符号 的 整数 ， 在 将 它 与 寄存 器 中 的 内 容 相 加 之 前 ， 必 须 扩展 它 的 符号 位 使 其 与 寄存 器 的 
字 长 相同 (请 看 2.1.3 节 )。 

图 2-13 说 明了 两 种 使 用 变 址 的 方法 。 在 图 2-13a 中 ， 指 针 寄 存 器 R1 中 包含 有 一 个 存储 单元 的 


Add 20(Rt),R2 | 









1000 | 1000 I RI 
20 = 偏 移 量 
1020 
a) 偏 移 量 作为 一 个 常数 给 出 
Add 1000RDR2 — 
1000 
20 = IRE 


1020 


b) 偏 移 量 在 变 址 寄存 器 中 
图 2-13 变 址 寻 址 





地 址 ， 数 值 X 定 义 了 一 个 从 这 个 地 址 到 找到 操作 数位 置 的 偏 移 量 (也 称 为 位 移 量 )。 在 图 2-13b 中 
具体 说 明了 所 使 用 的 另 一 种 选择 。 这 里 ， 常 数 X 相 当 于 一 个 内 存 地 址 ， 而 这 个 变 址 寄存 器 中 的 内 
容 定 义 了 一 个 到 操作 数 的 偏 移 量 。 无 论 在 哪 种 情 
况 下 ， 有 效 地址 是 两 个 值 的 和 ; 一 个 是 在 指令 中 N 
明确 给 出 的 ， 另 一 个 是 存储 在 一 个 寄存 器 中 的 。 — Lis _ 
为 了 理解 变 址 寻 址 的 作用 ， 考 虑 一 个 有 关 学 LIST+4 ， 





学 让 


生 选 修 课程 考试 分 数 表 的 一 个 简单 例子 。 假 设 这 个 “LIST+8 ， C C wa OOO 

成 绩 表 开始 的 位 置 在 LIST 处 ， 它 的 结构 如 图 2-14 所 ”LIST+ 12 U M 

示 。4 个 字 长 的 存储 块 构成 一 个 记录 ,记录 中 储存 LST+16， ED — 

着 与 每 个 学 生 相 关 的 信息 。 每 个 记录 由 学 生 的 标 而 验 1 . 
识 号 (ID)， 紧 接着 是 学 生 在 三 个 测验 中 所 得 的 分 M2 


数 构成 。 在 这 个 班 里 有 nz 个 学 生 ， 这 个 mn 值 被 存储 | 

在 单元 N 中 ， 这 个 单元 紧 挨 在 这 张 表 的 前 面 。 按 | 

照 学生 的 ID 号 和 考试 的 分 数 给 出 信息 ， 假 设 该 存 f 

铺 器 是 按 字 节 可 编 址 的 并 且 字 长 是 32 位 的 。 I 
我 们 应 该 注意 到 ， 图 2-14 中 的 这 张 表 代表 着 图 2-14 一 张 学 生 记分 表 

一 个 n 行 4 列 的 二 维 数组 。 每 行 包含 一 个 学 生 的 数据 项 ， 而 每 列 给 出 了 ID 号 和 -一 个 考试 的 分 数 。 
假设 我 们 想 要 计算 在 每 次 考试 中 所 有 得 分 的 总 和 ， 并 将 这 三 个 和 储存 在 存储 单元 SUMI、 

SUM2 和 SUM3 中 。 图 2-15 中 给 出 了 一 个 可 以 用 于 


这 项 任务 的 程序 。 在 循环 体内 ， 程 序 按照 图 2-13a ai MASTRO 

中 描述 的 方式 使 用 了 变 址 寻 址 方式 ， 去 访问 一 个 Q ear R2 

学 生 记 录 中 三 个 得 分 中 的 每 一 个 分 数 。 寄 存 器 RO Clear R3 

当 作 为 变 址 寄存 器 。 在 进入 循环 前 ，RO 被 设置 成 Move N.R4 

指向 第 一 个 学 生 记录 ID 的 单元 ， 因 此 ， 它 包含 的 a AROS RI 

是 LIST 的 地 址 。 N ' 
在 通过 第 一 次 循环 时 ， 第 一 个 学 生 的 考试 得 N. PAN 

分 加 到 了 保存 在 寄存 器 R1、R2 和 R3 的 和 中 ， 这 Decrement  R4 

些 值 在 初始 化 时 清 成 了 0。 这 些 得 分 可 以 使 用 变 Branch>0 LOOP 

址 寻 址 方式 4 (R0)、8 (RO0) 和 12 (RO) 进 行 访问 。 变 w ao SUM 

址 寄存 器 RO 用 16 进 行 增值 ， 指 向 第 二 个 学 生 的 ID Move R3SUM3 

单元 。 寄 存 器 R4 初 始 化 时 的 内 容 为 z 值 ， 每 一 次 

循环 结束 时 它 的 内 容 减 1。 当 R4 的 内 容 减 到 0 时 ， 图 2-15 用 于 访问 图 2-14 中 给 出 的 


所 有 学 生 的 记录 就 都 被 访问 到 了 ， 并 且 循 环 结束 。 考试 分 数 表 的 变 址 寻 址 方式 
在 那 之 前 ， 条 件 转移 指令 将 控制 返回 到 循环 的 开始 处 去 处 理 下 一 个 记录 。 最 后 三 条 指令 将 R1、 
R2 和 R3 中 的 累加 和 传递 到 相应 的 内 存单 元 SUM1、SUM2 和 SUM3 中 。 

这 里 要 强调 的 是 变 址 寄存 器 R0 中 的 内 容 ， 当 它 作为 访问 所 得 分 数 的 变 址 寻 址 方式 时 其 值 不 
能 够 被 改变 。R0 的 内 容 只 能 被 循环 中 的 最 后 一 个 Add 指 令 改 变 ， 这 样 从 一 个 学 生 的 记录 转向 下 一 
个 学 生 的 记录 。 





一 般 地 说 ， 变 址 方式 有 助 于 访问 那些 特定 的 操作 数 ， 这 些 操作 数 的 存储 单元 是 用 相对 于 保 





38 £ 2 + 


存 操作 数 的 数据 结构 中 的 一 个 参照 点 来 定义 的 。 在 刚刚 给 出 的 这 个 例子 中 .学生 连续 记录 的 ID 
位 置 是 参考 点 ， 考 试 分 数 是 使 用 变 址 寻 址 方式 访问 的 操作 数 。 

我 们 已 经 介绍 了 变 址 寻 址 的 最 基本 的 形式 。 在 实际 编程 中 还 有 - - 些 这 类 基本 形式 的 变形 ， 
它们 对 内 存 操作 数 的 访问 也 是 非常 有 效 的 。 例 如 ， 第 二 个 寄存 器 可 以 用 来 作为 保存 偏 移 量 X， 在 
这 种 情况 下 我 们 可 以 将 变 址 方式 写成 : 

(Ri, Rj) 
其 有 效 地 址 是 寄存 器 Ri 和 Rj 内 容 的 和 。 第 二 个 寄存 器 通常 称 做 基 址 寄存 器 。 这 种 变 址 寻 址 方式 在 
访问 操作 数 方面 提供 了 更 多 的 灵活 性 ， 因 为 ， 有 效 地址 的 两 部 分 都 可 以 被 改变 。 

作为 应 用 这 些 灵活 性 的 一 个 例子 ， 我 们 再 来 考虑 图 2 -14 中 给 出 的 学 生 记录 的 数据 结构 。 在 
图 2-15 的 程序 中 ， 在 三 个 Add 指 令 循环 的 开始 处 使 用 了 不 同 的 变 址 值 去 访问 不 同 的 考试 分 数 。 假 
设 每 个 记录 中 包含 有 许多 的 数据 项 ， 可 能 比 在 这 个 例子 中 给 出 的 三 个 考试 分 数 项 要 多 得 多 。 在 
这 种 情况 下 ， 我 们 就 需要 用 一 条 包含 有 第 二 个 循环 (人 嵌 套 ) 的 指令 来 替换 这 三 条 Add 指 令 。 也 就 
是 这 个 记录 连续 单元 的 起 始 位 置 (参考 点 ) 被 保留 在 指针 寄存 器 RO 中 ， 相 对 于 寄存 器 RO 中 的 内 
容 到 各 个 项 的 偏 移 量 可 以 保存 在 另 一 个 的 寄存 器 中 。 这 个 寄存 器 的 内 容 每 当 通过 一 次 内 部 循环 
时 将 被 增值 (请 看 习题 2.9)。 

变 址 方式 还 有 一 种 使 用 两 个 寄存 器 加 上 - -个 当 数 的 版 本 ， 这 可 以 表示 为 : 

X (Ri, Rj) 
在 这 种 情况 下 ， 有 效 地 址 是 常数 X 与 寄存 器 Ri 及 Rj 内 容 的 和 。 这 种 新 增加 的 灵活 性 在 访问 一 条 记 
录 内 部 的 每 一 项 中 多 个 部 分 时 是 有 用 的 ， 这 里 一 个 项 的 开始 是 由 寻 址 方式 的 《Ri，Rj) 部 分 来 指 
明 的 。 换 名 话 说， 这 种 方式 实现 了 一 个 三 维 数组 方式 。 


2.5.4 ”相对 寻 址 


我 们 已 经 用 处 理 器 的 通用 寄存 器 定义 了 变 址 方式 。 如 果 程 序 计数 器 PC 是 利用 一 个 通用 寄存 
器 代替 的 ， 就 得 到 了 这 种 方式 的 另 一 个 有 用 版 本 。 这 时 X (PC) 可 以 当 作 一 个 内 存单 元 的 地 址 ， 
它 离 程序 计数 器 指向 的 位 置 有 X 个 字 节 的 距离 。 以 后 的 地 址 单元 是 “相对 ”于 程序 计数 器 而 确定 
的 ， 而 程序 计数 器 总 是 指出 一 个 程序 中 的 当前 执行 位 置 ， 相 对 的 模式 名 字 与 这 个 寻 址 类 型 有 关 。 

相对 模式 一 一 有 效 地址 使 用 变 址 方式 来 确定 ， 在 此 变 址 方式 中 用 程序 计数 器 替代 通用 寄存 
RI 

这 种 方式 可 以 用 于 访问 数据 操作 数 。 但 是 ， 它 的 最 常用 用 途 是 在 转移 指令 中 指明 目标 地 址 。 
比如 有 这 样 一 条 指令 : 





Branch >0 LOOP 


如 果 转 移 条 件 满足 ， 可 使 得 程序 执行 转移 到 由 名 字 LOOP 命 名 的 目标 单元 上 。 这 个 单元 的 位 置 可 
以 用 所 说 明 的 一 个 从 程序 计数 器 的 当前 值 开始 的 偏 移 量 计 算 而 得 到 。 由 于 转移 的 目标 可 能 在 转 
移 指 令 的 前 面 或 后 面 ， 所 以 给 出 的 偏 移 量 是 -一 个 有 符号 的 数 。 

回想 一 下 在 一 条 指令 执行 的 过 程 中 ， 处 理 器 对 PC 做 增值 使 其 指向 下 一 条 指令 。 大 多 数 计算 
机 在 相对 模式 中 计算 有 效 地 址 时 使 用 这 个 更 新 的 值 。 例 如 ， 假 设 在 图 2.12 的 程序 中 Branch 指 令 使 
用 相对 模式 生成 转移 目标 地 址 LOOP。 假 定 该 循环 体 中 的 四 条 指令 ， 从 LOOP 处 开始 分 别 位 于 内 
存单 元 1000、1004、1008 和 1012 中 。 因 此 ， 生 成 目标 地 址 时 PC 的 最 新 内 容 将 是 1016。 为 了 转向 
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单元 LOOP(1000)， 需 要 的 偏 移 值 是 X = - 16。 

汇编 语言 中 允许 转移 指令 使 用 标号 写 出 转移 的 目标 ， 如 图 2-12 所 示 。 当 汇编 程序 处 理 这 样 的 
指令 时 ， 它 计算 需要 的 偏 移 值 ， 在 这 种 情况 下 该 值 是 -16， 并 且 使 用 寻 址 方式 - 16(PC) 产 生 相 应 
的 机 器 指令 。 


2.5.5 附加 方式 


到 目前 为 止 已 讨论 了 五 种 在 大 多 数 计算 机 中 可 见 到 的 基本 寻 址 方式 一 一 立即 、 寄 存 器 、 绝 对 
(直接 )、 间 接 和 变 址 方式 。 我 们 还 给 出 了 许多 变 址 方式 的 通用 版 本 ， 所 有 这 些 寻 址 方式 可 能 
不 能 在 某 一 台 计 算 机 中 都 找到 。 尽 管 这 些 方式 对 于 一 般 的 计算 是 足够 了 ， 但 是 许多 计算 机 还 提 
供 了 附加 模式 ， 其 目的 在 于 协助 某 些 特殊 程序 的 设计 任务 。 下 面 描述 的 两 种 方式 对 于 访问 内 在 
的 连续 存储 单元 中 的 数据 项 是 有 效 的 。 

自动 递增 方式 一 一 该 操作 数 的 有 效 地 址 是 在 指令 中 指明 的 一 个 寄存 器 中 的 内 容 。 每 当 访问 过 
该 操作 数 后 ， 这 个 寄存 器 的 内 容 自 动 增加 ， 去 指向 某 个 表 中 的 下 一 个 数据 项 。 

我 们 采用 将 指明 的 寄存 器 放 在 圆 括号 中 的 方法 来 表示 这 种 自动 递增 方式 ， 表 示 这 个 寄存 器 
的 内 容 是 作为 有 效 地 址 使 用 的 ， 后 面 跟着 一 个 加 号 表示 这 些 内 容 在 操作 数 被 访问 后 将 要 被 增值 。 
因此 ， 自 动 递增 方式 被 写成 : 








(Ri)+ 
默认 情况 下 ， 当 按 这 种 方式 给 出 时 其 递增 量 是 1。 但 在 一 个 按 字 节 寻 址 的 存储 器 中 ， 这 种 方式 将 
仅 对 访问 一 些 表 的 连续 字 节 有 用 。 为 了 在 一 个 按 字 节 寻 址 的 具有 32 位 字 长 的 存储 器 中 访问 连续 
的 字 ， 这 个 增 量 必 须 是 4。 对 于 具有 自动 递增 方式 的 计算 机 ， 它 可 以 用 与 访问 操作 数 的 大 小 相符 
的 值 来 递增 寄存 器 中 的 内 容 。 因 此 ， 对 于 与 字 节 大 小 相同 的 操作 数 其 增 量 是 1， 对 于 16 位 的 操作 
数 其 增 量 是 2， 对 于 32 位 的 操作 数 其 增 量 是 4。 因 为 操作 数 的 大 小 通常 是 作为 一 个 指令 操作 代码 
的 一 部 分 被 说 明 的 ， 所 以 用 (Ri) + 来 表示 自动 递增 方式 就 足够 了 。 
如 果 可 以 使 用 自动 递增 方式 ， 可 以 将 它 用 在 图 2-12 中 的 第 一 条 Add 指 令 中 ， 而 第 二 条 Add 指 
令 可 以 被 取消 。 这 个 改进 后 的 程序 在 图 2-16 中 给 出 。 
作为 自动 递增 方式 的 一 种 匹配 方式 ， 男 一 种 访问 逆序 列表 数据 项 的 有 效 方式 是 : 
自动 递减 方式 一 指令 中 给 出 的 寄存 器 的 内 容 首先 做 自动 递 碱 ， 然 后 作为 这 个 操作 数 的 有 效 
地 址 使 用 。 
我 们 采用 将 这 个 指明 的 寄存 器 放 在 圆 括 号 中 的 形式 来 表示 自动 递减 方式 ， 前 面 用 一 个 减 号 
说 明 在 作为 一 个 有 效 地 址 使 用 之 前 ， 这 个 寄存 器 中 的 内 容 要 被 递 碱 。 因 此 、 我 们 写 做 : 
- (Ri) 





Move 
Move 
Clear 
Add 


Decrement 
Branch>0 
Move 





图 2-16 对 图 2-12 中 的 程序 使 用 自动 递增 寻 址 方式 
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在 这 种 方式 中 ， 操 作 数 按照 递减 地 址 顺序 进行 访问 。 读 者 一 定 会 奇怪 ， 为 什么 在 使 用 自动 递 碱 
方式 中 地 址 使 用 之 前 要 做 递 碱 ， 而 在 使 用 自动 递增 方式 中 在 地 址 使 用 之 后 才 牧 递增 。 这 其 中 的 
主要 理由 在 2.8 节 中 给 出 ， 在 那里 我 们 将 说 明 如 何 将 这 两 种 方式 一 起 使 用 来 实现 重要 的 堆栈 数据 
结构 。 

自动 递增 和 自动 递减 寻 址 方式 执行 的 动作 显然 可 以 用 两 条 指令 来 完成 ， 一 条 是 访问 操作 数 ， 
另 一 条 是 对 保存 操作 数 地 址 的 寄存 器 做 增值 或 减 值 。 将 两 种 操作 合并 成 一 条 指令 ， 从 而 可 以 减 
少 执行 这 个 给 定 任务 所 需 的 指令 数量 。 但 是 ， 在 第 8 章 中 我 们 将 指出 ， 将 两 种 操作 合并 在 一 个 单 
指令 中 并 不 总 是 有 利 的 。 


2.6 汇编 语言 


机 器 指令 用 0 和 1 模式 来 表示 。 这 种 模式 在 讨论 或 准备 程序 时 是 很 不 便 的 。 因 此 ， 我 们 使 用 
符号 名 来 表示 这 些 模 式 。 到 目前 为 止 , 已 经 使 用 了 自然 单词 比如 像 Move、Add、Increment| 以 及 
Branch 作 为 指令 操作 去 表示 相应 的 二 进 制 码 模 式 。 当 为 一 台 指 定 的 计算 机 写 程序 时 ， 这 些 单词 通 
常 使 用 称 为 助 记 符 的 缩写 形式 来 代替 ， 比 如 ，MOV、ADD、INC 和 BR。 同 样 地 ， 我 们 使 用 标识 
符 R3 来 表示 寄存 器 3， 用 LOC 表 示 一 个 存储 器 单元 。 这 些 符 号 名 以 及 使 用 规则 的 一 个 完整 集合 构 
成 了 一 种 程序 设计 语言 ， 通 常 叫 做 汇编 语言 。 使 用 这 些 助 记 符 描述 完整 的 指令 和 程序 的 规则 集 
合 称 为 这 种 语言 的 语法 。 

使 用 汇编 语言 编写 的 程序 可 以 被 叫做 汇编 程序 的 程序 自动 翻译 成 机 器 指令 的 序列 。 这 个 汇 
编程 序 是 实用 程序 集中 的 一 个 ， 它 是 系统 软件 的 一 部 分 。 EAEE BIEMA DRIT 一 样 ， 作 
为 机 器 指令 的 一 个 序列 被 存储 在 计算 机 的 内 存 中 。 一 个 用 户 程序 通常 是 通过 键盘 输入 到 计算 机 
中 ， 并 储存 在 内 存 或 是 磁盘 的 任意 位 置 上 的 。 在 这 点 上 ， 用 户 程序 简单 地 被 看 作为 字符 数字 流 
的 一 个 集合 。 当 汇编 程序 执行 时 ， 它 读 取 用 户 程序 做 分 析 ， 然 后 生成 所 需要 的 机 器 语言 程序 。 
而 机 器 语言 中 包含 着 将 要 被 计算 机 执行 的 用 0 和 1 模式 说 明 的 指令 。 按 照 原始 的 字符 数字 文本 形 
式 组 成 的 用 户 程序 叫做 源 程 序 ， 汇 编 后 的 机 器 语言 程序 岂 做 目标 程序 。 我 们 将 在 2.6.2 节 中 讨论 
汇编 程序 是 如 何 工 作 的 。 首 先 给 出 一 些 汇 编 语言 本 身 的 外 部 特征 。 

汇编 语言 对 于 一 个 给 定 的 计算 机 来 讲 可 能 区 分 也 可 能 不 区 分 大 小 写 ， 也 就 是 说 ， 它 可 以 区 
别 也 可 以 不 区 别 大 写 和 小 写字 母 。 为 了 改善 文本 的 易 读 性 ， 在 例子 里 我 们 用 大 写字 母 表示 所 有 
名 称 和 标号 。 例 如 ， 将 Move 指 令 写 成 : 

MOVE RO, SUM 
助 记 符 MOVE 表 示 被 这 个 指令 执行 操作 的 二 进 制 模式 ， 或 叫做 OP 码 。 汇 编程 序 将 这 个 助 记 符 翻 
译 成 这 台 计 算 机 能 够 理解 的 二 进 制 OP 码 。 

OP 码 助 记 符 后 边 最 少 跟随 一 个 空格 字符 ， 再 后 面 的 信息 给 出 了 具体 的 操作 数 。 在 我 们 的 例 
子 中 ， 源 操作 数 是 在 寄存 器 R0 中 。 这 个 信息 后 面 跟随 的 是 目的 操作 数 的 具体 说 明 ， 用 -- 个 逗号 
与 源 操作 数 隔 开 ， 中 间 不 插入 空格 。 目 的 操作 数 在 内 存单 元 中 ， 它 使 用 名 字 SUM 来 表示 它 的 二 
进 制 地 址 。 

因为 对 于 具体 操作 数 的 单元 可 以 有 多 种 寻 址 方式 来 说 明 ， 汇 编 语 言 必 须 说 明 使 用 的 是 哪 一 
种 方式 。 例如， 一 个 数字 的 值 或 者 一 个 单独 使 用 的 名 字 ， 就 像 前 面 指令 中 的 SUM， 可 以 用 来 表 
示 绝 对 方式 。# 号 通常 表示 一 个 立即 操作 数 。 这 样 指令 

ADD #5,R3 








表示 对 寄存 器 R3 的 内 容 加 上 数字 5 并 且 将 结果 放 回 到 寄存 器 R3 中 。 这 个 # 叶 不 是 惟一 表示 立即 寻 
址 的 方法 。 在 有 些 汇编 语言 中 ， 所 需要 的 寻 址 方式 在 OP 码 的 助 记 符 中 指出 。 在 这 种 情况 下 ， 一 
个 给 定 的 指令 对 于 不 同 的 寻 址 方式 有 着 不 同 的 OP 码 助 记 符 。 例 如 ， 前 面 的 Add 指 令 可 以 写成 
ADDI 5,R3 
助 记 符 ADDI 中 的 后 绥 I 表 示 源 操作 数 是 用 立即 寻 址 方式 给 出 的 。 
间接 寻 址 通常 由 放置 在 圆 括号 中 的 代表 指向 操作 数 的 指针 名 或 符号 名 来 表示 。 例 如 ， 如 果 
数字 5 需要 放置 在 一 个 存储 单元 中 ， 它 的 地 址 被 保存 在 寄存 器 R2 中 ， 期 望 的 动作 可 以 这 样 表示 : 
MOVE #5, (R2) 
或 者 是 : 
MOVEI 5, (R2) 
2.6.1 汇编 指示 
除了 对 在 程序 中 表示 的 指令 提供 一 种 机 制 以 外 ， 汇 编 语 言 还 允许 程序 设计 员 说 明 将 源 程序 翻 
译 成 目标 程序 时 所 需要 的 其 他 信息 。 我 们 已 提 到 过 需要 对 任何 一 个 在 程序 中 使 用 的 名 字 分 配 数 字 
的 值 。 假 设 名 字 SUM 用 来 表示 值 200， 这 个 情况 可 以 通过 这 样 一 条 语句 传递 到 汇编 程序 的 系统 中 : 
SUM EQU 200 
这 个 语句 在 目标 程序 运行 时 不 代表 一 条 将 要 被 执行 的 指令 ; 实际 上 ， 它 甚至 不 出 现在 目标 
程序 中 。 它 只 是 简单 地 通知 汇编 程序 ， 名 字 SUM 无 论 出 
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“在 内 存 的 什么 位 置 存放 数据 操作 数 。 

为 了 提供 这 些 信息 ， 源 程序 可 以 写成 如 图 2-18 给 出 
的 形式 。 这 个 程序 以 汇编 指示 开始 ， 我 们 已 讨论 了 NUM 6 
Equate 指 示 符 EQU， 它 通知 汇编 程序 SUM 的 值 是 多 少 。 
第 二 个 汇编 指示 ORIGIN 告诉 汇编 程序 在 内 存 的 什么 位 图 2-17 图 2-12 程 序 的 内 存 分 配 


现在 程序 的 任何 地 方 都 要 用 值 200 来 取代 。 这 样 的 语句 wo me NRI 
叫做 汇编 指示 (或 汇编 命令 )， 它 在 汇编 程序 将 源 程序 104 Mow #NUMI.R2 | 
翻译 成 目标 程序 时 起 作用 。 108 Clear RO aa 
为 了 进一步 说 明 汇编 语言 的 使 用 ， 让 我 们 重新 考虑 LOOP 12 | Ad (RDRO | 

图 2-12 中 的 程序 。 为 了 在 计算 机 中 运行 这 个 程序 ， 需 要 按 06 | Add MR | 
照 汇 编 语言 的 要 求 编写 源 代码 ， 具 体 说 明生 成 目标 程序 120 | Decremem RI i 
所 有 需要 的 信息 。 假 设 它 的 每 条 指令 和 每 个 数据 项 占据 i24 | Brancho roop | 
内 存 中 的 一 个 字 ， 这 是 一 种 非常 简单 的 情况 ， 但 有 助 于 128 | Move RoSUM | 
保持 这 个 例子 的 简单 性 。 另 外 假设 存储 器 是 按 字 节 寻 址 | 
的 并 且 它 的 字 长 是 32 位 。 还 假定 这 个 目标 程序 Load 到 了 | | 
主 存储 器 中 ， 如 图 2-17 所 示 。 图 中 给 出 了 该 程序 为 了 运行 | I 
被 Load 后 的 机 器 指令 和 所 需 数据 项 占据 的 内 存 地 址 。 如 sum 20 f 一 
果 汇 编程 序 按 这 种 分 配 产生 目标 程序 ， 它 需要 知道 N 204 | 0 — | 
,怎样 去 解释 名 字 。 NUMI 208 1 — 

. 在 内 存 的 什么 位 置 存放 指令 。 Num 22 | | 
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置 存放 以 下 的 数据 块 。 在 本 例 情况 下 ， 被 指明 的 地 址 单元 是 204。 因 为 这 个 单元 装 入 了 数值 100 
( 它 是 这 个 列表 中 的 项 数 )， 需 要 用 DAIAWORD 指 示 符 告诉 汇编 程序 这 个 要 求 。 它 说 明 数 据 值 100 
将 被 存放 在 地 址 为 204 的 内 存 字 中 。 


EQU 200 
ORIGIN 204 
DATAWORD 100 
RESERVE 400 
ORIGIN 100 
MOVE N,R1 
MOVE #NUM1,R2 
CLR 

ADD 

ADD 

DEC 

BGTZ 

MOVE 

RETURN 

END 





图 2-18 对 于 图 2-17 中 的 程序 使 用 汇编 语言 表述 的 形式 


任何 将 指令 或 数据 存放 在 内 存单 元 的 指令 ， 可 以 给 出 一 个 内 存 地 址 标号 。 这 个 标号 被 分 配 
了 一 个 值 ， 这 个 值 等 于 那个 单元 的 地 址 。 因 为 ，DATAWORD 语 句 给 出 的 标号 是 N， 名 字 N 被 分 
配 的 值 是 204。 无 论 何 时 在 程序 的 其 他 任何 地 方 碰 到 N， 它 都 被 替换 成 这 个 值 。 这 种 将 N 当 作 一 个 
标号 的 方式 等 价 于 使 用 汇编 指令 : 

N EQU 204 
RESERVE 指 示 符 宣布 这 400 个 字 节 的 内 存 块 是 专门 用 来 保存 数据 的 ， 并 且 名 字 NUM1 与 地 址 208 
相关 联 。 这 个 指令 并 不 能 完成 将 任何 数据 加 载 到 这 些 单 元 里 ， 只 有 使 用 输入 程序 ， 才 能 把 数据 
装 和 人 到 该 内 存 中 ， 就 像 我 们 要 在 本 章 后 面 解释 的 那样 。 

第 一 个 ORIGIN 指示 符 说 明 目 标 程序 的 指令 将 从 内 存 起 始 地 址 100 开 始 Load。 它 后 面 跟着 的 
是 使 用 相应 的 助 记 符 和 语法 编写 的 源 程序 指令 。 源 程序 最 后 一 条 语句 是 汇编 指示 END ， 它 告诉 
汇编 程序 这 里 是 源 程 序 正文 的 结束 点 。END 指 令 中 包含 标号 START， 它 是 这 个 程序 开始 执行 单 
元 的 地 址 。 f 

我 们 已 经 解释 了 图 2-18 中 除 RETURN 以 外 的 所 有 语句 。RETURN 是 一 个 汇编 指示 ， 它 注 明 在 
这 个 点 上 执行 程序 应 该 结束 。 它 使 得 汇编 程序 在 这 一 点 上 插入 一 条 适当 的 机 器 指令 ， 访 指令 将 
控制 权 返还 给 计算 机 的 操作 系统 。 

许多 汇编 语言 要 求 源 程 序 语 句 的 编写 按 以 下 方式 进行 : 

Label Operation Operand(s) Comment 

(标号 ) (操作 ) (操作 数 ) (注释 ) 
这 四 个 字 航 采用 适当 的 定 界 符 ,通常 用 一 个 或 多 个 空格 字符 ， 进 行 分 隔 。 标 号 Label 是 任 选 的 一 
个 与 内 存 地 址 相关 的 名 字 ， 在 此 处 机 器 语言 指令 从 将 要 装 入 的 语句 中 产生 。 标 号 也 可 以 与 数据 
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项 的 地 址 相关 联 。 在 图 2-18 中 有 五 个 标号 : SUM、N、NUM1、START 和 LOOP。 

操作 字段 中 包含 着 所 需 指 令 或 汇编 程序 命令 的 OP 码 助 记 符 。 操 作 数 字段 包含 着 用 于 访问 的 
一 个 或 多 个 操作 数 的 地 址 信息 ， 具 体 是 一 个 或 多 个 操作 数 取决 于 指令 的 类 型 。 注 释 字 段 将 被 汇 
编程 序 所 忽略 ， 它 是 使 程序 更 容易 被 理解 的 文档 。 

我 们 已 经 介绍 的 仅仅 是 汇编 语言 的 最 基本 特性 。 任 何 一 台 计 算 机 在 这 些 语 言 细节 上 和 复 
度 上 是 不 完全 相同 的 。 


2.6.2 程序 的 汇编 和 执行 


3 


用 汇编 语言 编写 的 源 程序 在 能 够 被 执行 之 前 必须 被 汇编 成 机 器 语言 的 目标 程序 。 这 是 由 汇 
编程 序 来 完成 的 ， 它 将 用 在 机 器 指令 中 使 用 的 二 进 制 码 替 换 所 有 表示 操作 数 的 符号 以 及 寻 址 方 
式 ， 并 且 用 它们 的 实际 值 灰 换 所 有 的 名 字 和 标号 

汇编 程序 为 指令 和 数据 块 分 配 地 址 ， 起 始 地 址 由 ORIGIN 汇编 指令 给 出 。 它 还 插入 一 些 可 能 
是 在 DAIAWORD 命 令 中 给 出 ， 并 由 RESERVE 命 令 要 求 保留 在 内 存 空间 的 常数 。 

汇编 处 理 的 一 个 关键 部 分 是 决定 那些 将 要 用 来 替代 名 字 的 值 。 在 某 种 情况 下 ， 名 字 的 值 是 
由 EQU 指 示 说 明 的 ， 这 是 一 种 简单 的 方式 。 在 另 一 些 情况 下 ， 名 字 是 由 一 个 给 定 指令 的 标号 字 
段 定义 的 ， 用 这 种 名 字 表示 的 值 是 由 汇编 后 的 目标 程序 中 这 条 指令 所 在 的 位 置 决 定 的 。 因 此 ， 
汇编 程序 必须 对 连续 指令 在 生成 机 器 码 时 的 地 址 保持 了 解 。 例 如 ， 名 字 START 和 LOOP 将 分 别 被 
分 配 的 值 是 100 和 112。 

在 有 些 情 况 下 ， 汇 编程 序 不 直接 用 这 个 地 址 的 实际 值 去 取代 表示 这 个 地 址 的 名 字 。 例 如 ， 
在 一 个 转移 指令 中 ， 表 示 将 要 转 和 的 那个 转移 位 置 (转移 目标 ) 的 名 字 不 是 用 实际 地 址 赫 换 的 。 
转移 指令 通常 在 机 器 码 中 用 相对 地 址 方式 指定 转移 目标 的 方法 来 实现 ， 就 像 在 2.5 节 中 解释 的 那 
样 。 拒 编程 序 计算 转移 偏 移 量 ， 即 到 目标 的 距离 ， 并 将 它 放 进 机 器 指令 中 。 

当 汇 编程 序 扫描 一 个 源 程序 时 ， 它 保留 所 有 名 字 以 及 它们 在 符号 表 中 相对 应 的 数据 值 。 这 样 ， 

当 一 个 名 字 第 二 次 出 现时 ， 就 使 用 它 在 符号 表 中 的 值 来 替换 它 。 当 一 个 名 字 在 给 出 它 的 值 之 前 作 
为 一 个 操作 数 出 现时 ， 便 会 引发 一 个 问题 。 例如 ， 如 果 需 要 一 个 向 前 转移 操作 时 就 发 生 了 这 种 情 
况 。 汇 编程 序 将 不 能 确定 转移 目标 ， 因 为 这 个 被 引用 的 名 字 还 没有 记录 在 符号 表 中 。 解 决 这 个 问 
题 的 简单 办 法 是 让 汇编 程序 对 源 程序 做 第 二 遍 扫 描 。 在 第 一 遍 扫 描 期 间 ， 它 建立 了 一 个 完整 的 符 
号 表 。 在 这 次 扫描 结束 时 ， 所 有 的 名 字 都 已 经 被 分 配 了 数值 。 然 后 汇编 程序 对 源 程序 做 第 一 遍 扫 
描 ， 并 从 符号 表 中 对 所 有 的 名 字 做 替换 。 这 样 的 汇编 程序 叫做 二 遍 扫 描 汇 编程 序 。 

汇编 程序 将 目标 程序 存储 在 一 个 磁盘 中 。 在 它 开始 运行 之 前 ， 目 标 程序 必须 装载 到 计算 机 
的 内 存 中 。 为 了 完成 这 项 工作 ， 另 一 个 叫做 装载 程序 的 实用 程序 必须 已 经 在 内 存 中 了 。 执 行 这 
个 装载 程序 就 是 运行 一 系列 的 输入 操作 ， 需 要 将 机 器 语言 程序 从 磁盘 中 传递 到 内 存 的 指定 位 置 
上 。 装 载 程序 必须 知道 这 个 程序 的 长 度 和 将 要 存放 它 的 内 存 地 址 。 汇编 程序 通常 把 这 些 信 息 放 
在 目标 程序 的 头 部 。 对 已 经 装载 的 目标 码 ， 装 载 程序 就 使 用 转移 到 可 执行 语句 的 第 -一 一 条 指令 上 
的 方法 ， 使 这 个 目的 程序 开始 执行 。 这 条 指令 的 被 调用 地 址 已 经 包含 在 汇编 语言 程序 FPT, È 
是 END 汇 编 指 令 的 操作 数 。 汇 编程 序 将 这 个 地 址 保存 在 该 磁盘 上 的 目标 程序 的 头 部 。 

当 目 标 程序 开始 执行 后 ， 它 会 一 直 进 行 到 结束 ， 除 非 在 程序 中 有 逻辑 性 错误 。 用 户 必须 能 够 


容易 地 发 现 错误 ， 汇 编程 序 能 够 监测 并 报告 语法 错误 。 为 了 帮助 用 户 发 现 其 他 的 程序 设计 错误 ， [6] 


系统 软件 通常 提供 一 个 调试 程序 。 这 个 程序 使 用 户 能 够 在 一 些 感 兴趣 的 点 上 停止 目标 程序 的 运行 ， 
去 检查 各 种 处 理 器 寄存 器 和 内 存单 元 的 内 容 。 我 们 将 在 第 4 章 中 更 详细 地 介绍 程序 的 调试 。 
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2.6.3 数 的 表示 


在 与 数值 打交道 时 ， 使 用 熟悉 的 十 进 制 记 数 法 通常 是 很 方便 的 。 当 然 ， 这 些 值 是 用 二 进 制 
方式 存储 在 计算 机 中 的 。 有 些 情 况 下 ， 直 接 指 定 二 进 制 模式 是 比较 方便 的 。 大 多 数 汇编 程序 允 
许 数值 按照 不 同 的 方式 去 表示 ， 使 用 的 约定 由 汇编 语言 的 语法 来 定义 。 例 如 ， 考 虑 数字 93， 它 
用 8 位 二 进 制 数 表示 为 01011101。 如 果 这 个 值 被 当 作 立 即 操作 数 使 用 ， 它 可 以 作为 一 个 十 进 制 数 
给 出 ， 就 像 如 下 的 指令 : 

ADD #93, R1 
或 者 用 一 个 前 缀 符号 (比如 百 分 号 ) 识别 成 二 进 制 数 ， 比 如 : 
ADD #%01011101, R1 

二 进 制 数 可 以 写成 比较 紧凑 如 十 六 进 制 方式 的 数 ， 这 时 数 的 四 位 可 以 用 一 位 十 六 进 制 数 表 
示 。 十 六 进 制 表示 法 是 BCD 码 的 一 种 直接 扩展 ，BCD 码 在 附录 E 中 给 出 。 在 BCD 码 中 前 十 个 模式 
0000、0001、0010、…、1001 用 数 0、1、2、…、9 表 示 ， 其 余 的 六 个 4 位 模式 1010、1011、…、 
1111 用 字母 A、B、…、F 表 示 。 在 十 六 进 制 表示 法 中 ， 十进制 数 93 变 成 5D。 在 汇编 语言 中 ， 常 
常用 一 个 美元 符号 做 前 缀 表示 一 个 十 六 进 制 数 ， 这 样 前 面 这 条 指令 应 写成 : 

ADD #$5D,RI1 


2.7 基本 输入 /输出 操作 


在 本 章 的 前 面 章 节 中 描述 了 机 器 指令 和 寻 址 方式 ， 并 假定 那些 在 指令 操作 中 使 用 的 数据 已 
经 储存 在 内 存 中 了 。 现 在 我 们 来 查看 数据 在 计算 机 的 内 存 和 外 设 之 间 传 递 的 方法 。 输 入 /输出 
(VO) 操作 很 重要 ， 并 且 它 们 的 执行 方法 会 对 计算 机 的 性 能 产生 重要 的 影响 。 这 一 专题 我 们 将 在 
第 4 章 中 详细 讨论 。 这 里 介绍 一 些 基 本 的 思想 。 

考虑 一 个 这 样 的 任务 ， 从 键盘 读 入 一 个 输入 字符 然后 在 显示 屏幕 上 产生 一 个 输出 字符 。 完 
成 这 个 MO 任务 的 一 种 简单 方法 是 使 用 众所周知 的 程序 控制 JO 方 法 。 从 键盘 到 计算 机 的 实际 传递 
速度 是 受用 户 打字 速度 所 限制 的 ， 它 不 会 超过 每 秒 几 个 字符 。 而 从 计算 机 到 显示 器 的 输出 传送 
速度 是 非常 高 的 。 这 个 速率 根据 字符 传输 中 经 过 的 计算 机 和 显示 设备 之 间 的 连接 情况 而 决定 ， 
一 般 是 每 秒 几 千 个 字符 。 但 是 ， 它 还 是 比 处 理 器 的 速度 慢 很 多 ， 处 理 器 每 秒 能 执行 几 百 万 条 指 
令 。 这 种 处 理 器 和 WO 之 间 速度 的 差异 产生 了 在 机 制 上 要 对 它们 之 间 的 数据 传送 进行 同步 的 要 求 。 

解决 这 一 问题 的 方法 如 下 : 在 输出 时 ， 处 理 器 发 送 第 一 个 字符 ， 然 后 就 等 待 来 自 于 显示 器 
的 表示 已 接收 到 这 个 字符 的 信号 。 然 后 再 发 送 第 二 个 字符 ， 依 次 类 推 。 来 自 键盘 的 输入 使 用 类 
似 的 方法 ; 处理 器 等 待 着 一 个 标志 信号 ， 这 个 信号 表示 键盘 上 的 一 个 字符 键 被 吉 击 ， 并 且 它 的 
编码 已 在 一 些 与 键盘 相关 联 的 缓冲 寄存 器 中 保存 着 ， 然 后 处 理 器 去 读 这 个 代码 。 

如 图 2-19 所 示 ， 键 盘 和 显示 器 是 独立 的 设备 。 在 键盘 上 击 打 一 个 键 的 动作 并 不 能 自动 地 使 相 
应 的 字符 在 显示 屏 上 显示 。 在 IO 程序 中 有 一 个 指令 块 将 字符 传递 到 处 理 器 中 ， 而 另 一 个 相关 的 
指令 块 完 成 该 字符 的 显示 。 

考虑 将 一 个 字符 代码 从 键盘 传送 到 处 理 器 中 的 问题 。 击 打 一 个 键 ， 就 可 将 相应 的 字符 编码 
存 进 一 个 与 键盘 相关 联 的 8 位 缓冲 寄存 器 中 。 我 们 将 这 个 寄存 器 称 为 DATAIN， 如 图 2-19 所 示 。 为 
了 通知 处 理 器 在 DATAIN 中 有 一 个 有 效 的 字符 ， 状 态 控 制 标 志 SIN 被 置 为 1!。 有 一 个 程序 监控 SIN， 
当 发 现 SIN 被 置 为 时， 处 理 器 就 去 读 DATAIN 中 的 内 容 。 当 这 个 字符 被 传送 到 处 理 器 时 ，SIN 自 





动 地 被 清 为 0。 如 果 在 键盘 中 有 第 二 个 字符 输入 ，SIN 再 次 被 置 成 1 并 且 重 复 该 处 理 过 程 。 

当 字符 从 处 理 器 传送 到 显示 器 时 ， 发 生 类 似 的 处 理 过 程 。 在 这 个 传送 过 程 中 使 用 了 缓冲 寄 
存 器 DATAOUT 和 状态 控制 标志 SOUT。 当 SOUT 等 于 1 时 ， 表 示 显 示 器 已 准备 好 去 接收 一 个 字符 
了 。 在 程序 控制 之 下 ， 处 理 器 监控 SOUT， 并 且 当 SOUT 被 设置 为 1 时 ， 处 理 器 就 将 一 个 字符 码 传 
送 到 DATAOUT 中 。 当 一 个 字符 被 传送 进 DATAOUT 后 SOUT 被 清 为 0， 当 显示 设备 准备 好 接收 第 
工 个 字符 时 ，SOUT 再 次 被 置 成 1。 缓 冲 寄存 器 DATAIN、 DAIAOUT 以 及 状态 标志 SIN、SOUT 都 
是 通常 我 们 所 了 解 的 设备 接口 电路 中 的 一 部 分 。 用 于 各 种 设备 的 这 些 电 路 都 需 经 过 一 条 总 线 与 
处 理 器 相连 ， 如 图 2-19 所 示 。 
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图 2-19 处 理 器 、 键 盘 及 显示 器 的 总 线 连接 


为 了 执行 JO 传 递 ， 我 们 需要 能 够 执行 状态 标志 的 检查 和 数据 在 处 理 器 与 JO 设 备 间 传送 的 机 
器 指令 。 这 样 的 指令 在 形式 上 与 那些 在 处 理 器 与 内 存 间 传送 数据 的 指令 相似 。 比 如 ， 处 理 器 能 
监控 键盘 状态 标志 SIN， 并 且 用 以 下 的 操作 序列 将 一 个 字符 从 DATAIN 中 传递 到 寄存 器 R1 中 ， 

READWAIT Branch to READWAIT if SIN = 0 

Input from DATAIN to R1 
转移 操作 通常 用 两 条 机 器 指令 实现 。 第 一 条 指令 测试 状态 标志 ， 第 二 条 执行 转移 。 虽 然 在 计算 
机 与 计算 机 之 间 有 一 些 细节 上 的 不 同 ， 但 主要 的 思想 是 处 理 器 执行 一 个 简短 的 循环 等 待 实现 对 
状态 标志 SIN 的 监控 ， 并 且 当 点 击 一 个 键 而 使 SIN 置 为 1 时 继续 传递 输入 的 数据 。 这 个 输入 操作 重 
新 将 SIN 清 0。 

类 似 的 操作 序列 可 以 用 于 将 输出 传送 到 显示 器 上 ， 即 : 
WRITEWAIT Branch to WRITEWAIT if SOUT = 0 

Output from R1 to DATAOUT 
X B 4032181 5R HPN i kal. Ar RISE KTATBOEJIRSRRAESOUTBE SE FR ERI, X 
时 表示 显示 器 是 空 的 ， 可 以 接收 字符 了 。 输 出 操作 从 R1 向 DATAOUT 中 传送 一 个 字符 用 于 显示 ， 
然后 它 将 SOUT 清 为 0。 

我 们 假设 SIN 的 初始 状态 是 0，SOUT 的 初始 状态 是 1。 这 个 初始 化 工作 通常 是 由 设备 控制 电 
路 执行 的 ， 它 是 在 这 些 设备 被 置 于 计算 机 控制 之 下 程序 开始 运行 以 前 完成 的 。 

到 目前 为 止 ， 我 们 假设 处 理 器 访问 指令 和 操作 数 时 ， 寻 址 过 程 总 是 访问 内 存单 元 。 在 许多 
计算 机 中 使 用 了 一 个 叫做 存储 器 映射 1O 的 策略 ， 在 这 个 策略 中 -- 些 内 存 的 地 址 值 被 当 作 访问 外 
围 设备 的 缓冲 寄存 器 ， 比 如 像 DATAIN 和 DATIAOUT 等 。 这 样 ， 就 不 需要 用 特殊 的 指令 去 访问 这 
些 寄存 器 中 的 内 容 了 ; 数据 可 以 在 这 样 的 寄存 器 之 间 传 递 ， 而 处 理 器 使 用 的 指令 我 们 已 经 介绍 
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过 了 ， 像 Move、Load 或 Store 等 。 例 如 ， 用 下 面 这 条 指令 可 以 将 键盘 字符 缓冲 区 DAIAIN 中 的 内 
容 传递 到 处 理 器 寄存 器 R1 中 : 

MoveByte DATAIN, R1 
类 似 地 ， 使 用 下 面 的 指令 可 以 将 寄存 器 R1 中 的 内 容 传 递 到 DATAOUT 中 : 

MoveByte R1, DATAOUT 


当 缓 冲 器 DATAIN 和 DATAOUT 被 分 别 引 用 时 ， 状 态 标 志 SIN 和 SOUT 被 自动 清除 。MoveByte 操 作 
码 表示 这 个 操作 数 的 大 小 是 一 个 字 节 ， 以 便于 将 它 与 操作 码 Move 做 区 分 ， 因 为 Move 操 作 已 经 在 
字 操 作 数 的 传递 中 被 使 用 了 。 在 图 2-19 中 我 们 已 经 确定 了 两 个 数据 缓冲 器 ， 它 们 可 以 像 两 个 内 存 
单元 一 样 被 寻 址 。 为 了 用 同样 的 方式 处 理 状态 标志 SIN 和 SOUT， 可 以 使 用 给 它们 分 配 不 同 地 址 
的 方式 来 实现 。 但 是 ， 比 较 通 用 的 方法 是 将 SIN 和 SOUT 保 存在 设备 状态 寄存 器 中 ， 每 个 设备 对 
应 一 位 。 我 们 假定 寄存 器 INSTATUS 和 OUTSTATUS 的 第 三 位 分别 对 应 于 SIN 和 SOUT。 出 才 描 
述 的 读 操作 现在 可 以 用 以 下 机 器 指令 序列 来 实现 : 
READWAIT Testbit #3, INSTATUS 
Branch =0 READWAIT 
MoveByte DATAIN, RI 
写 操作 可 以 用 如 下 序列 实现 : 
WRITEWAIT Testbit #3, OUTSTATUS 
Branch =0 WRITEWAIT 
MoveByte R1, DAIAOUT 
Testbit 指 令 测试 在 目标 单元 中 某 一 位 上 的 状态 ， 这 里 被 测试 位 的 位 置 是 由 第 一 个 操作 数 指出 的 。 
如 果 这 个 被 测试 位 等 于 零 ， 则 转移 指令 的 条 件 为 真 ， 产 生 一 个 转向 循环 等 待 开始 处 的 转移 。 当 


设备 就 绪 时 ， 也 就 是 说 当 这 个 测试 位 变 成 1 时 ， 数 据 从 输入 缓冲 器 中 读 出 或 是 被 写 人 到 输出 缓冲 
器 中 。 


图 2-20 给 出 的 程序 使 用 这 两 种 操作 从 键盘 上 输入 一 行 字符 并 将 它们 输出 到 一 个 显示 设备 中 。 
当 字符 一 个 一 个 被 读 人 人 时， 它们 被 储存 在 内 存 的 一 个 数据 区 里 ， 然 后 回 显 到 显示 器 上 。 当 读 到 
一 个 回 车 字符 CR 并 且 存 储 内 容 被 发 送 到 显示 器 中 时 ， 这 个 程序 结束 。 存 储 数据 区 第 一 个 字 节 的 


Move #LOC,R0 初始 化 指针 寄存 器 RO， 使 其 指 
向 内 存 中 存放 字符 的 第 -一 个 单元 


TestBit #3,INSTATUS 等 待 一 个 字符 输入 到 键盘 缓冲 

Branch=0 READ 器 DATAIN 中 

MoveByte DATAIN,(RO) 将 字符 从 DATAIN 传 送 到 内 存 中 
(这 将 SIN 清 0) 

TestBit #3.OUTSTATUS 等 待 显示 器 准备 就 结 

Branch=0 ECHO 

MoveByte (RO,DATAOUT 将 刚才 读 入 的 字符 移 到 显示 器 
缓冲 寄存 器 〈 这 将 SOUT 清 0) 

Compare — #CR,(RO)+ 检查 刚才 读 人 的 字符 是 否 为 CR 
(HEF) mkr. MEE N 


Branch#0 READ 去 读 取 另 一 个 字符 。 同 时， 递增 
指针 来 存储 下 一 个 字符 





图 2-20 读 一 行 字符 并 将 它 显示 出 来 的 一 段 程序 
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地 址 ， 也 就 是 存储 该 行 的 位 置 是 LOC。 寄 存 器 RO 用 来 指向 这 个 存储 区 ， 并 且 它 被 程序 中 第 一 条 
指令 用 LOC 地 址 进行 了 初始 化 设置 。 比 较 指 令 中 的 自动 递增 寻 址 方式 在 每 读 人 一 个 字符 并 被 显 
示 后 ， 对 RO 做 递增 处 理 。 

程序 控制 WO 方式 需要 处 理 器 连续 地 参与 1O 的 活动 ， 在 图 2-20 给 出 的 程序 中 几乎 所 有 的 执行 
时 间 都 用 在 了 两 个 循环 等 待 中 了 ， 直 到 处 理 器 等 待 到 了 一 个 敲 入 的 字符 或 是 等 待 到 了 显示 器 变 
成 为 可 用 状态 。 在 这 种 情况 下 ， 应 该 尽量 避免 浪费 处 理 器 的 执行 时 间 。 另 一 种 基于 中 断 的 1/O 技 
术 使 用 可 以 用 来 改进 处 理 器 的 利用 率 。 这 种 技术 将 在 第 4 章 中 讨论 。 


2.8 堆栈 和 队列 


计算 机 程序 中 常常 需要 利用 已 有 的 子 程序 结构 去 执行 一 个 特殊 的 子 任务 。 为 了 构成 这 种 控 
制 结构 以 及 形成 主 程序 与 子 程序 之 间 的 信息 连接 ， 使 用 了 一 种 叫做 堆栈 的 数据 结构 。 本 节 中 我 
们 将 描述 堆栈 以 及 另 一 个 与 其 紧密 相关 的 称 为 队列 的 数据 结构 。 

被 程序 操作 的 数据 可 以 用 多 种 方法 来 组 织 。 我 们 已 经 接触 了 像 表 这 样 的 数据 结构 ， 现 在 来 
考虑 一 种 重要 的 称 为 堆栈 的 数据 结构 。 堆 栈 是 一 个 数据 元 素 表 ， 其 中 的 元 素 通常 是 字 或 是 字 节 ， 
它 具 有 的 访问 约束 是 只 有 在 该 表 的 一 端 数 据 元 素 可 以 被 增加 或 是 被 移出 。 这 一 端 叫做 该 栈 的 栈 
顶 ， 另 一 端 为 栈 底 。 这 种 结构 有 了 时 也 称 为 下 推 栈 。 设 想 自助 餐厅 里 的 一 释 扒 子 ， 客 户 从 这 区 得 
子 的 项 部 拿 走 新 盘子 ， 而 清洗 干净 的 盘子 又 被 添加 到 这 苔 盘子 的 顶部 。 另 一 种 称 为 后 进 先 出 
(LIFO) 栈 ， 也 是 用 来 描述 这 种 类 型 的 存储 机 制 的 ， 它 表示 最 后 放 入 堆栈 中 的 数据 项 在 检索 开始 
时 是 第 一 个 被 取出 的 。 术 语 压 入 和 弹出 分 别 用 来 描述 向 栈 中 放 入 一 个 新 的 数据 项 和 从 栈 的 栈 顶 
取出 一 个 数据 项 。 

储存 在 计算 机 内 存 中 的 数据 可 以 被 组 织 成 一 个 栈 ， 其 中 连续 的 元 素 占据 连续 的 存储 单元 。 
假设 第 一 个 元 素 放 在 BOTTOM 位 置 上 ， 当 新 的 元 素 被 压 进 栈 时 ， 它 们 被 放置 在 紧 挨 着 的 低地 址 
单元 中 。 在 我 们 的 讨论 中 .使 用 了 一 个 按照 减 小 存储 地 址 方向 进行 增长 的 栈 ， 因 为 这 是 一 种 惯 
用 的 方式 。 

图 2-21 给 出 了 一 个 在 计算 机 内 存 中 保存 字数 据 项 的 堆栈 。 它 所 保存 的 数字 值 以 43 为 栈 底 ， 
-28 为 栈 顶 。 有 一 个 处 理 器 寄存 器 用 来 保存 栈 中 元 素 地 址 的 轨迹 ， 它 在 任何 时 候 都 指向 栈 顶 。 
这 个 寄存 器 叫做 栈 指针 (SP)。 它 可 以 是 一 个 通用 寄存 器 或 是 一 个 专门 用 于 这 一 功能 的 专用 寄存 
器 。 如 果 假 设 一 个 按 字 节 寻 址 的 存储 器 具有 32 位 的 字 长 ， 压 栈 操作 可 以 这 样 实现 : 

Subtract #4, SP 
Move NEWITEM, (SP) 
这 里 Subtract 指 令 从 保存 在 SP 中 的 目标 操作 数 中 减 去 源 操作 数 4， 再 把 结果 放 回 SP 中 。 第 二 条 指 
令 从 单元 NEWITEM 中 传送 一 个 字 到 该 栈 的 栈 顶 上 ， 在 传送 之 前 对 栈 指 针 减 4。 弹 出 操作 可 以 这 
样 实现 : 
Move (SP), ITEM 
Add #4,SP 
这 两 条 指令 从 栈 中 将 栈 顶 值 移出 到 单元 ITEM ， 然 后 将 栈 指针 加 4， 使 其 指向 新 的 栈 顶 元 素 。 图 
2-22 给 出 了 在 图 2-21 中 的 栈 中 完成 这 些 操作 的 效果 。 
如 果 处 理 器 具有 自动 递增 和 自动 递 碱 寻 址 方式 ， 压 栈 操 作 可 以 用 单条 指令 执行 : 
Move NEWITEM, - (SP) 
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a) 将 NEWITEM 中 的 内 容 压 人 栈 中 b) 弹出 到 ITEM 后 


图 2-22 在 图 2-21 的 栈 中 栈 操作 的 效果 
弹出 操作 也 能 用 下 面 一 条 指令 来 完成 : 
Move (SP) +, ITEM 
当 在 一 个 程序 中 使 用 堆栈 时 ， 通 常 是 在 内 存 中 划分 出 一 个 固定 数量 的 存储 空间 。 在 这 种 情 
况 下 ， 当 栈 已 经 达到 它 的 最 大 限定 值 时 ， 必 须 避 免 再 向 栈 中 压 人 数据 项 的 操作 。 同 样 ， 也 要 如 
免 企图 从 空 栈 中 弹出 数据 项 的 操作 ， 这 些 操 作 将 产生 一 个 程序 设计 错误 。 假 设 有 一 个 栈 从 单元 
2000 (BOTTOM) 向 下 运行 ， 最 大 不 能 超过 单元 1500 的 位 置 。 这 个 栈 指针 用 地 址 值 2004 进 行 初 





始 化 ， 在 新 数据 被 存 进 栈 之 前 SP 的 内 容 要 减 4。 因 此 ， 初 始 值 2004 表 示 第 一 个 被 压 人 栈 中 的 数据 
项 将 是 在 单元 2000 处 。 为 了 防止 向 一 个 已 满 的 栈 上 压 人 数据 项 或 是 从 空 栈 中 弹出 一 个 数据 项 ， 
单独 的 进 栈 和 退 栈 操作 指令 可 以 用 图 2-23 中 给 出 的 指令 序列 来 代替 。 
比较 指令 
Compare src, dst 
执行 操作 
[dst] - [src] 
然后 根据 产生 的 结果 设置 条 件 码 标志 。 但 是 这 个 操作 不 改变 任何 一 个 操作 数 的 值 。 


SAFEBJOP Compare #2000,SP 恰 查 栈 指针 包含 的 地 
Branch> 0 — EMPTYERROR a AERA T2000. 4 
EMPTYERROR 例 程 采取 


适当 的 动作 


(SP)+ITEM 和 否则， 将 栈 顶 弹出 到 
存储 单元 TTEM 中 





a) 用 于 安全 弹出 操作 的 程序 


SAFEPUSH Compare #1500,SP 检查 栈 指 针 包 含 的 地 
Branch <0 FULLERROR 址 值 是 否 等 于 或 小 下 
1500。 如 果 是 ， 栈 已 满 。 
转移 到 FULLERROR 程 序 
采取 适当 的 动作 


NEWITEM, - (SP) 否则 ， 将 存储 单元 
NEWITEM 中 的 内 容 压 入 
到 栈 中 





b) 用 于 安全 压 人 操作 的 程序 
图 2-23 在 弹出 和 压 人 操作 中 检查 空 栈 和 栈 溢出 错误 


另 一 个 有 效 的 类 似 于 堆栈 的 数据 结构 叫做 队列 。 数 据 被 存 人 和 从 一 个 队列 中 取出 是 按照 先 
进 先 出 (FIFO) 的 原则 进行 的 。 这 样 一 来 ， 如 果 我 们 假设 这 个 队列 按照 内 存 的 增加 地 址 方向 进 
行 增长 ， 这 是 一 种 惯例 ， 新 的 数据 被 加 在 队列 的 后 面 (高 地 址 端 ) ， 而 检索 是 从 队列 的 前 面 〈 低 
地 址 端 ) 进行 的 。 

在 堆栈 和 队列 的 实现 中 有 两 个 重要 的 不 同 之 处 。 栈 的 一 端 是 固定 的 ( 栈 底 )， 而 另 一 端 随 着 
数据 被 压 人 和 弹出 而 上 升 和 下 降 ， 需 要 一 个 单 指针 指出 任 一 给 定时 间 的 栈 顶 位 置 。 而 另 一 方面 ， 
当 在 后 面 增加 数据 并 从 前 面 移 走 数据 时 ， 队 列 的 两 端 都 要 移 向 高 地 址 ， 所 以 需要 两 个 指针 来 保 
存 两 个 端点 的 轨迹 。 

堆栈 和 队列 之 间 的 另外 一 个 不 同 之 处 就 是 ， 队 列 可 以 连续 地 沿 计算 机 存储 器 向 高 地 址 方向 
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移动 ， 对 这 一 点 没有 进一步 的 控制 。 将 队列 限制 在 内 存 一 个 固定 范围 内 的 方法 是 使 用 一 个 环形 
缓冲 区 。 我 们 假定 内 存 地 址 从 BEGINNING 到 END 被 分 配 作为 一 个 队列 ， 该 队列 的 第 一 项 被 输入 
到 单元 BEGINNING 中 ， 然 后 后 续 项 用 连续 输入 到 高 地 址 方向 的 方式 被 添加 到 队列 中 。 当 队列 到 
达 END 返 回 时 ， 如 果 有 些 项 已 经 从 队列 中 移出 ， 在 开始 处 就 产生 了 一 些 空格 。 因 此 ，、 返 回 指针 
复位 到 BEGINNING 值 上 ， 并 且 继 续 处 理 过 程 。 在 堆栈 情况 下 ， 一 定 要 注意 检测 何 时 分 配给 数据 
结构 的 空间 是 完全 满 的 或 完全 空 的 (请 看 习题 2.18 和 2.19)。 


29 子 程序 


在 一 个 给 出 的 程序 里 ， 常 常 需要 使 用 不 同 的 数据 值 多 次 执行 一 个 特殊 的 子 任务 。 这 样 的 子 
任务 通常 叫做 子 程序 。 例 如 ， 一 个 子 程序 可 以 对 正 张 函数 求 值 或 者 是 将 一 个 价值 表 按 照 递 增 或 
递减 顺序 分 类 排序 。 

可 以 包含 有 构成 子 程序 的 指令 块 ， 这 些 指令 块 可 以 在 程序 中 任何 需要 的 地 方 使 用 。 可 是 为 
了 市 省 空间 ， 只 有 一 个 构成 子 程序 的 指令 拷贝 存放 在 内 存 中 ， 任 何 需 要 使 用 该 子 程序 的 程序 只 
是 简单 地 转移 到 该 子 程序 的 起 始 位 置 即 可 。 当 一 个 程序 将 控制 转移 到 一 个 子 程序 时 ， 我 们 称 其 
为 调用 子 程序 。 执 行 这 个 转移 操作 的 指令 叫做 调用 (Cal) 指令 。 

一 个 子 程序 被 执行 后 ， 调 用 它 的 程序 必须 继续 执行 ， 执 行 紧 连 在 这 条 调用 子 程序 指令 后 面 
的 指令 。 在 子 程序 中 用 执行 一 个 Return 指 令 的 方式 返回 到 调用 它 的 程序 中 。 因 为 子 程序 可 能 在 一 
个 调用 程序 的 任何 位 置 上 被 调用 ， 所 以 必须 准备 好 返回 到 适当 的 位 置 上 。 调 用 程序 重新 恢复 执 
行 的 位 置 是 当 执行 Call 指 令 时 被 修改 的 PC 所 指出 的 位 置 。 因 此 ， 为 了 使 调用 Call 指 令 能 够 正确 地 
返回 到 调用 程序 中 ， 必 须 保 存 PC 中 的 内 容 。 

一 个 在 计算 机 中 能 够 调用 并 能 够 从 子 程序 中 返回 的 方法 称 为 子 程序 链接 法 。 最 简单 的 子 程 
序 链接 法 是 将 返回 地 址 存储 在 一 个 指定 的 单元 中 ， 这 个 单元 也 可 以 是 一 个 专门 用 于 这 种 功能 的 
寄存 器 ， 这 种 寄存 器 称 为 链接 寄 友 器 。 当 子 程序 完成 了 它 的 任务 时 ，Retum 指 令 用 通过 链接 寄存 
器 的 间接 转移 返回 到 调用 程序 中 。 

Call 指 令 只 是 一 个 特殊 的 转移 指令 ， 它 执行 以 下 的 操作 : 

“ 将 PC 中 的 内 容 存 储 到 链接 寄存 器 中 。 

“ 转移 到 由 这 条 指令 指定 的 目标 地 址 中 。 

Return (返回 ) 指令 是 一 条 特殊 的 转移 指令 ， 它 执行 的 操作 是 : 

“ 转移 到 链接 寄存 器 中 保存 的 地 址 中 。 

图 2-24 说 明了 这 一 进程 。 





图 2-24 使 用 链接 寄存 器 的 子 程序 链接 











Call Return 
图 2-24 (4%) 


2.9.1 子 程 序 杠 塞 及 处 理 器 堆栈 


使 用 一 个 子 程序 调用 另 一 个 子 程序 的 程序 虽 做 子 程序 性 穴 。 在 这 种 情况 下 ， 第 二 个 调用 的 返 
回 地 址 也 被 存储 在 链接 寄存 器 里 、 这 就 会 破坏 它 原 有 的 内 容 。 因 此 ， 在 调用 其 他 子 程序 之 前 ， 把 
链接 寄存 器 中 的 内 容 存储 到 其 他 的 单元 里 是 十 分 重要 的 ， 否 则 第 一 个 子 程序 的 返回 地 址 将 会 丢失 。 

子 程序 的 贬 套 可 以 达到 任何 一 种 深度 。 最 终 ， 上 一 个 被 调用 的 子 程序 完成 它 的 计算 并 返回 
到 调用 它 的 子 程序 中 。 这 个 前 一 次 返回 所 需要 的 返回 地 址 ， 是 上 一 个 调用 按照 钨 套 调 用 顺序 生 
成 的 。 也 就 是 说 ,返回 地 址 的 生成 和 使 用 是 按照 后 进 先 出 的 顺序 进行 的 。 这 使 人 联想 到 ， 与 子 
程序 调用 有 关 的 返回 地 址 应 该 被 压 人 到 一 个 栈 中 。 许 多 处 理 器 将 这 个 处 理 作 为 一 个 由 Call 指 令 执 
行 的 操作 自动 完成 。 被 指定 成 栈 指针 的 特殊 寄存 器 SP 将 用 在 这 个 操作 中 。 这 个 栈 指针 指向 处 理 
器 栈 。Call 指 令 将 PC 中 的 内 容 压 入 处 理 器 栈 中 ， 然 后 将 子 程序 地 址 装 入 到 PC 中 ;Retum 指 令 从 处 
理 器 栈 中 将 返回 地 址 弹出 到 PC 中 。 


2.9.2 参数 传递 


当 调 用 一 个 子 程序 了 时， 程序 必须 要 给 子 程序 提供 参数 ， 也 就 是 那些 将 在 计算 中 使 用 的 操作 
数 或 是 它们 的 地 址 。 然 后 ， 子 程序 返回 另外 的 一 些 参 数 ， 在 本 例 中 是 计算 出 的 结果 。 这 种 在 调 
用 程序 和 子 程序 之 间 信 息 的 交换 称 为 参数 传递 。 参 数 传递 能 够 用 多 种 方法 实现 。 参 数 可 以 放 在 
寄存 器 或 存储 器 单元 中 ， 这 些 地 方 是 能 够 被 子 程序 访问 到 的 。 或 者 ， 这 些 参 数 可 以 放 在 用 来 保 
存 返 回 地 址 的 处 理 器 栈 中 。 

通过 处 理 器 寄存 器 做 参数 传递 是 简单 有 效 的 。 图 2-25 给 出 了 在 图 2-16 的 程序 中 如 何 将 添加 一 
个 数字 表 的 过 程 作成 一 个 子 程序 ， 通 过 寄存 器 传递 参数 来 实现 。 这 个 表 的 大 小 为 mw， 存 储 在 内 存 
单元 N 中 ， 第 一 个 数 的 地 址 NUM1， 通 过 寄存 器 R1 和 R2 被 传递 。 这 个 和 在 子 程序 中 计算 出 来 并 通 
过 寄存 器 RO 传 回 给 调用 程序 。 在 图 2-25 中 ， 前 四 条 指令 组 成 了 调用 程序 的 相关 部 分 。 其 中 的 前 
两 条 指令 把 x 和 NUM1 装 人 到 R1 和 R2 中 。Call 指 令 转移 到 子 程序 的 起 始 位 置 LISTADD 处 ， 这 条 指 
令 还 将 返回 地 址 压 入 到 处 理 器 栈 中 。 子 程序 计算 出 这 个 和 并 将 它 放 入 到 RO 中。 在 返回 操作 被 子 
程序 执行 后 ， 这 个 和 被 调用 程序 储存 到 内 存单 元 SUM 中 。 

如 果 涉 及 到 许多 的 参数 ， 那 么 可 用 的 通用 寄存 器 就 有 可 能 不 能 满足 向 子 程序 传递 参数 的 需 
要 。 而 另 一 方面 ， 栈 的 使 用 是 非常 灵活 的 ， 一 个 栈 可 以 处 理 大 量 的 参数 。 以 下 的 例子 说 明了 这 
种 方法 。 图 2-26a 给 出 了 将 图 2-16 写 成 一 个 子 程序 LISTADD 的 程序 ， 这 个 子 程序 可 以 被 任意 的 程 
序 调 用 去 完成 对 一 个 数字 表 求 和 。 传 递 给 这 个 子 程序 的 参数 是 该 列表 中 的 第 一 个 数据 地 址 以 及 
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列表 中 的 项 数 ， 子 程序 执行 加 法 运算 并 返回 计算 的 和 ， 参 数 被 压 入 到 由 寄存 器 SP 指向 的 处 理 器 
栈 中 。 假 设 在 子 程序 被 调用 之 前 ， 栈 顶 在 图 2-26b 中 的 第 一 级 上 。 调 用 程序 将 地 址 NUM1 和 数值 n 
压 入 栈 中 ， 并 调用 子 程序 LISTADD。Call 指 令 也 把 返回 地 址 压 入 栈 中 ， 现 在 栈 顶 是 在 第 二 级 上 。 


Move NRI R1 作 为 计数 器 
Move #NUM1,R2 ”R2 指 向 列表 
Call LISTADD 调用 子 程序 
Move RO,SUM 保存 结果 


子 程 序 


LISTADD Clear 将 和 初始 为 0 
LOOP Add 累加 列表 项 
Decrement 
Branch>0 
Return 返回 到 调用 程序 





图 2-25 图 2-16 中 的 程序 写成 一 个 子 程序 ; 通过 寄存 器 传递 参数 


这 个 子 程序 使 用 了 三 个 寄存 器 ， 因 为 这 些 寄存 器 中 可 能 包含 属于 调用 程序 的 有 效 数据 ， 它 
们 的 内 容 应 该 被 压 入 栈 中 进行 保存 。 我 们 已 经 使 用 了 单 指令 MoveMultiple 将 寄存 器 R0 到 R2 的 内 
容 储存 到 这 个 堆栈 中 。 许 多 处 理 器 都 有 这 样 的 指令 ,现在 栈 顶 是 在 第 三 级 上 。 子 程序 使 用 变 址 
寻 址 方式 从 这 个 堆栈 里 访问 参数 x 和 NUM1。 注 意 这 一 操作 不 改变 栈 指针 ， 因 为 有 效 的 数据 项 仍 
然 是 在 这 个 栈 的 栈 顶 。 数 值 n 加 载 到 R1 里 作为 计数 的 初始 值 ， 并 且 地 址 NUMI1 装 入 到 R2 中 ， 它 当 
作 扫 描 这 个 列表 条 目的 一 个 指针 。 在 计算 结束 时 ， 寄 存 器 RO 中 包含 着 计算 的 和 。 在 子 程序 返回 
到 调用 程序 之 前 ，R0 的 内 容 被 放 人 到 这 个 栈 中 ， 替 换 了 参数 NUMI ， 因 为 这 个 参数 不 再 需要 了 。 
然后 这 三 个 被 子 程序 使 用 的 寄存 器 内 容 从 栈 中 被 还 原 。 此 时 栈 顶 中 是 第 二 级 的 返回 地 址 。 子 程 
序 返 回 后 ， 调 用 程序 将 结果 存在 单元 SUM 中 ， 再 用 SP 增加 8 的 方式 将 栈 顶 降 到 它 原来 的 级 别 上 。 

按 值 和 按 地 址 的 参数 传递 

注意 在 图 2-25 和 图 2-26 中 两 个 参数 NUM1 和 n 的 实际 值 被 传递 到 了 子 程序 中 ， 子 程序 的 目的 是 为 
了 对 一 个 数字 列表 做 加 法 。 调 用 程序 不 传递 实际 的 列表 项 ， 而 传递 在 这 个 列表 中 第 一 个 数 的 地 址 ， 
这 种 技术 叫做 校 地 址 传递 。 第 二 个 参数 是 按 值 传递 ， 也 就 是 项 数 的 实际 数字 n 被 传递 到 子 程序 中 。 


2.9.3 堆栈 的 结构 


现在 我 们 来 看 在 图 2-26 的 例子 中 存储 空间 是 如 何 作为 栈 来 使 用 的 。 在 子 程序 执行 期 间 ， 栈 顶 
的 6 个 单元 包含 了 子 程序 需要 的 条 目 。 这 些 单元 构成 了 一 个 子 程序 的 私有 工作 空间 ， 当 子 程序 进 
入 时 创建 ， 当 子 程序 将 控制 返回 到 调用 程序 时 被 释放 。 这 种 空间 叫做 栈 结构 。 如 果子 程序 需要 
更 多 的 空间 用 于 局 部 存储 变量 ， 它 们 也 可 以 用 栈 进行 分 配 。 

图 2-27 给 出 了 一 个 对 于 栈 结构 中 的 信息 经 常 使 用 的 布局 例子 。 除 了 堆栈 指示 器 SP 外 ， 通 常 还 
需要 另 一 个 指针 寄存 器 ， 叫 做 结构 指针 (FP)， 它 是 为 了 方便 对 传递 到 子 程序 中 的 参数 进行 访问 ， 
以 及 便于 对 子 程序 中 使 用 的 局 部 变量 进行 访问 的 。 这 些 局 部 的 变量 只 能 在 该 子 程 序 中 使 用 ， 因 
此 对 于 它们 适合 使 用 与 子 程序 相关 的 栈 结构 进行 存储 空间 的 分 配 。 在 该 图 中 ， 我 们 假设 有 四 个 





参数 被 传递 到 子 程序 中 ， 有 三 个 局 部 变量 要 在 子 程序 内 部 使 用 ， 还 有 寄存 器 RO 和 R1 需 要 进行 
储 ， 因 为 它们 也 要 在 子 程序 中 被 使 用 。 


假设 栈 顶 在 第 一 级 
Move #NUMI, — (SP) 保存 参数 到 栈 中 


Move ， 
Call 调用 子 程序 

( 栈 顶 在 第 二 级 ) 
Move 4(SP),SUM 保存 结果 
Add #8,SP 恢复 栈 顶 

( 栈 预 在 第 一 级 ) 


LISTADD MoveMultiple R0-R2,- (SP) 保存 寄存 器 
( 栈 顶 在 第 二 级 ) 
Move 16(SP).R1 将 计数 器 初始 化 为 n 
Move 20(SP),R2 初始 化 指针 使 其 指向 列表 
Clear RO 将 和 初始 化 为 0 


Add (R2)+,R0 # 0213 $ H 
Decrement R1 


Branch> 0 ` LOOP 
Move R0,20(SP) 将 结果 保存 公 栈 中 
MoveMultiple (SP)+.R0 -R2 恢复 寄存 器 


寄存 
Retum 返 岂 到 调用 程序 





a) 调用 程序 和 子 程序 








[R2] 
返回 地 址 


NUMI 


b) 不 同时 刻 的 校 顶 
图 2-26 将 图 2-16 中 的 程序 写成 一 个 子 程序 ; 在 堆栈 上 传递 参数 


如 图 2-27 中 给 出 的 那样 ， 使 用 FP 寄 存 器 指出 的 单元 正 是 上 述 的 存储 返回 地 址 ， 我 们 可 以 使 用 
变 址 寻 址 方式 很 容易 地 访问 到 这 些 参数 和 局 部 变量 。 这 些 参数 可 以 用 地 址 8 (FP)、12 (FP)、… 访 
问 到 。 局 部 变量 可 以 用 -4 (FP). —8 (FP)、… 访 问 到 ，FP 中 可 以 保留 子 程序 运行 中 的 任何 一 个 
单元 ， 这 一 点 不 同 于 栈 指 针 SP 必须 总 是 指向 栈 中 当前 的 栈 顶 元 素 。 
现在 来 讨论 指针 SP 和 FP， 当 栈 结构 为 了 该 子 程序 的 一 个 特殊 请 求 而 被 建立 、 被 使 用 和 被 拆 
除 时 是 如 何 操作 的 。 在 图 2-27 中 我 们 开始 假定 SP 指向 原来 的 栈 顶 单元 ， 在 子 程序 被 调用 之 前 ， 调 
用 程序 将 四 个 参数 压 人 栈 中 。 然 后 当 执行 Call 指 令 时 ， 结 果 是 返回 地 址 被 压 人 栈 中 。 现 在 SP 指向 
了 这 个 返回 地 址 ， 并 且 子 程序 的 第 一 条 指令 将 要 被 执行 。 这 是 指向 被 设置 成 包含 有 适当 内 存 地 ”局 相 
址 的 结构 指针 FP。 因 为 FP 通常 是 一 个 通用 寄存 器 ， 它 可 能 包含 有 用 于 调用 程序 的 信息 。 因 此 ， 
它 的 内 容 被 压 人 栈 中 进行 保存 。 因 为 SP 现在 指向 这 个 位 置 ， 它 的 内 容 被 拷贝 到 FP 中 。 
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SP — | saved [R1] 


(结构 指针 ) 


.下 一 原来 的 TOS 





图 2-27 一 个 子 程序 栈 结构 的 例子 


这 样 一 来 ， 在 子 程序 中 前 两 条 指令 执行 的 是 : 
Move FP, —( SP ) 
Move SP, FP 
这 些 指 令 执 行 以 后 ，SP 和 FP 都 指向 了 保存 后 的 FP 的 内 容 。 现 在 三 个 局 部 变量 的 空间 被 以 下 指令 
的 执行 分 配 到 了 栈 中 : 
Subtract #12, SP 
最 后 ， 处 理 器 寄存 器 RO 和 R1 的 内 容 被 压 人 栈 中 进行 保存 。 此 时 ， 这 个 栈 结构 已 经 被 设置 成 图 中 
所 示 的 状况 。 
子 程序 现在 开始 执行 它 的 任务 。 当 这 个 任务 完成 时 ， 子 程序 弹出 R1 和 R0 的 保存 值 放 回 到 这 
些 寄存 器 中 ， 执 行 以 下 的 指令 从 栈 结构 中 删除 局 部 变量 : 
Add #12,SP 
并 且 弹 出 保存 的 FP 提 值 放 回 到 FP 中 。 这 时 候 ，SP 指 向 了 返回 地 址 ， 所 以 返回 指令 Return 可 以 执 
行 了 ， 将 控制 返还 给 了 调用 程序 。 
调用 程序 负责 从 栈 结构 中 删除 这 些 参 数 ， 其 中 一 些 可 能 是 子 程序 返 传 回来 的 结果 。 栈 指针 
现在 指向 了 原来 的 TOS ( 栈 顶 )， 又 返回 到 了 起 始点 。 
用 于 子 程序 仙 套 的 栈 结构 
当 子 程序 供 套 时 ， 堆 栈 是 用 于 处 理 返 回 地 址 的 最 合适 的 数据 结构 。 应 该 很 清楚 ， 当 子 程序 被 
调用 时 为 了 幅 套 子 程序 在 处 理 器 栈 上 建立 了 完整 的 栈 结构 。 在 这 一 点 ， 应 注意 在 当前 结构 中 栈 顶 
中 存储 的 FP 的 内 容 是 结构 指针 的 内 容 ， 这 个 结构 指针 是 用 于 调用 当前 子 程序 的 子 程序 栈 结构 。 
我 们 来 看 一 个 例子 ， 主 程序 调用 了 第 一 个 子 程序 SUB1， 然 后 在 其 中 又 调用 了 第 二 个 子 程序 





p # 48 SAREA 


SUB2， 该 过 程 由 图 2-28 给 出 。 对 应 于 这 样 的 两 个 嵌 套 子 程序 的 栈 结构 显示 在 图 2-29 中 。 所 有 与 
这 个 例子 相关 的 参数 都 被 传递 到 栈 中 ， 该 图 中 只 显示 了 在 这 三 个 程序 中 的 控制 流 和 数据 。 实 际 


的 计算 方法 没有 给 出 。 


执行 的 流程 如 下 : 主 程序 将 两 个 参数 param2 和 param1 按 顺序 压 进 栈 中 ， 然 后 调用 SUB1。 这 
里 第 一 个 子 程序 负责 计算 一 个 答案 并 使 用 栈 将 这 个 答案 传 回 主 程序 。 在 它 的 计算 过 程 中 ，SUBI1 
调用 了 第 二 个 子 程序 SUB2， 用 于 执行 一 些 子 任务 。SUB1 给 SUB2 传 递 了 一 个 单独 的 参数 param3 ， 
并 且 获 得 一 个 给 它 传 回来 的 结果 。 当 SUB2 执 行 了 它 的 Retum 指 令 以 后 ， 这 个 结果 被 SUB1 存 储 到 
了 寄存 器 R2 中 。SUB1 继 续 它 的 计算 ， 最 后 用 堆栈 方式 将 所 需要 的 答案 传 回 给 主 程序 。 当 SUB1 
执行 返回 指令 返回 到 主 程序 了 时， 主 程序 将 这 些 答案 存储 在 内 存单 元 RESULT 中 ， 并 且 使 用 它 继续 


计算 的 步 又 在 “下 条 指令 ”中 。 


第 一 个 子 程序 
2100 SUB1 
2104 


2108 
2112 


第 二 个 子 程序 
3000 SUB2 


Move’ 

Move 

Call 

Move 

Add 

next instruction 


Move 
Move 
MoveMultiple 
Move 
Move 


Move 
Call 
Move 


Move 
MoveMultipie 
Move 

Return 


Move 
Move 
MoveMultiple 
Move 


Move 
MoveMultiple 
Move 

Return 


图 2-28 KETEJ 


PARAM2, - (SP) 
PARAMI, - (SP) 
SUB1 
(SP),RESULT 
#8,SP 


FP ,~ (SP) 
SP.FP 
R0-R3,- (SP) 
8(FP)RO 
12(FP),R1 


PARAM3, - (SP) ` 


SUB2 
(SP)+,R2 


R3,8(FP) 
(SP)+,RO— R3 
(SP)+,FP 


FP ,— (SP) 
SP,FP 
RO~R]1,- (SP) 
8(FP)},RO 


R1,8(FP) 
(SP+R0-RI 
(SP)+,FP 


HEE ARH 


,保存 结果 
-恢复 栈 级 


保存 结构 指针 寄存 器 


载 人 结构 指针 
保存 寄存 器 
获取 第 一 个 参数 
获取 第 二 个 参数 


.将 一 个 参数 放置 到 栈 中 
弹出 SUB2 的 结果 到 R2 中 


将 答案 放 入 栈 中 
恢复 寄存 器 


.恢复 结构 指针 寄存 器 
返回 主 程序 


保存 指针 寄存 器 
载 人 结构 指针 
保存 寄存 器 RO 和 R1 
获取 参数 


将 SUB2 的 结果 放 入 栈 中 


恢复 寄存 器 RO 和 R1 


恢复 结构 指针 寄存 器 
返回 到 第 一 个 子 程序 
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在 图 2-28 注 释 中 给 出 了 如 何 管理 这 个 流程 的 细节 内 容 。 每 个 子 程序 执行 的 第 一 个 动作 是 设 
置 结 构 指 针 ， 保 存 了 前 一 个 栈 中 内 容 以 后 ， 再 保 
存 其 他 所 需要 寄存 器 的 内 容 。SUB1 使 用 了 R0 到 R3 [一 RS 
| [ROlfromSUB! | IROJ from SUBI => 






















的 四 个 寄存 器 ， 而 SUB2 使 用 了 两 个 寄存 器 RO 和 条 一 个 
R1。 这 些 寄 存 器 和 结构 指针 只 有 在 执行 返回 指令 FP —e | [FP] from SUBI 子 程序 的 
之 前 被 恢复 。 a |] Bg 
使 用 与 结构 指针 寄存 器 FP 有 关 的 变 址 寻 址 方 x Pm | 
式 ， 可 以 从 栈 中 加 载 参数 以 及 将 答案 放 回 到 栈 中 。 在 |  [R3]fomMain — | 
操作 中 使 用 的 字 节 偏 移 量 ， 通 常 是 8、12、16、- [ RfomMain | 
如 同 在 图 2-27 中 讨论 的 一 般 栈 结构 一 样 。 最 后 要 注 | [RDfomMain — | 
意 的 是 ， 调 用 程序 要 负责 从 栈 中 删除 参数 。 这 是 由 | RofomMain | | e 
主 程序 中 的 Add 指 令 和 在 SUB1 单 元 2164 中 的 Move FP 一 =| [FPlfomMain | 楼 结构 
指令 来 完成 的 ， 一 
人 一 
到 目前 为 止 , 我 们 已 介绍 了 下 列 的 指令 : Move、 ”| 一 一 原来 的 


Load. Store. Clear. Add. Subtract. Increment. : 
Decrement, Branch 、Testbit、 Compare. 、Call 和 图 2-29 图 2-28 的 栈 结构 

Retum。 使 用 这 13 条 指令 和 表 2-1 中 的 寻 址 模式 ， 已 经 可 以 编写 程序 例子 来 说 明 机 器 指令 的 执行 序 
列 了 ， 包 括 转移 和 子 程序 结构 。 我 们 还 说 明了 基本 的 存储 器 映射 7O 操 作 。 

这 个 小 指令 集 有 许多 的 元 余 ， 比 如 Load 和 Store 指 令 能 够 用 Move 指 令 代替 ，Increment 和 
Decrement 指 令 能 够 分 别 用 Add 和 Subtract 指 令 代 在， 而 Clear 指 令 可 以 用 包含 一 个 立即 操作 数 0 的 
Move 指 令 代 替 ; 因此 ， 只 用 余下 的 8 条 指令 就 已 经 可 以 满足 我 们 的 目的 了 。 但 是 ， 在 实际 的 机 器 
指令 系统 中 存在 一 些 匈 余 是 很 正常 的 ， 一 些 简单 的 操作 通常 能 够 用 多 种 不 同 的 方法 来 实现 。 有 
一 些 可 选择 的 方法 可 能 会 比 其 他 方法 更 有 效 。 在 这 一 节 中 ， 我 们 介绍 一 小 部 分 比较 重要 的 指令 ， 
这 些 指 令 是 在 大 部 分 指令 集中 都 存在 的 。 


2.10.1 逻辑 指令 


像 AND (与 )、OR (或 ) 和 NOT ( 非 ) 这 样 的 逻辑 操作 ， 适 合 于 对 那些 数字 电路 基本 构件 
的 按 位 操作 ， 就 像 在 附录 A 中 介绍 的 那样 。 它 也 可 以 用 于 软件 执行 中 的 逻辑 操作 ， 这 些 操作 可 以 
用 指令 来 完成 ， 这 些 指令 可 以 将 这 些 操作 独立 或 是 并 行 地 施加 于 一 个 字 或 一 个 字 节 的 所 有 位 上 。 
例如 以 下 指令 : 

Not dst 


是 对 保存 在 目的 操作 数 中 的 所 有 位 求 反 ， 即 将 1 变 成 0，0 变 成 1。 在 2.1.1 节 中 ， 我 们 看 到 将 1 加 到 
有 符号 正 数 的 反 码 格式 上 就 形成 了 一 个 补 码 格式 表示 的 负数 值 。 例 如 在 图 2-1 中 ， 通 过 给 0011 的 
反 码 格式 加 了 1， 使 +3 (0011) 转换 成 了 - 3 (1101)。 如 果 3 存 储 在 寄存 器 RO 中 ， 那 么 指令 : 

Not RO 

Add #1, RO 





就 完成 这 个 转换 。 很 多 计算 机 中 有 一 个 单 指令 : 
Negate RO 
可 以 完成 同样 的 事情 。 
现在 考虑 逻辑 指令 AND (与 ) 的 应 用 ， 它 在 源 操 作 数 和 目的 操作 数 上 执行 按 位 AND (与 ) 
操作 。 假 设 有 四 个 ASCH 字 符 被 保存 在 32 位 的 寄存 器 RO 中 。 在 某 个 任务 中 ， 我 们 希望 确定 最 左边 
的 字符 是 否 为 Z， 如 果 是 Z， 就 执行 条 件 转 移 到 YES。 从 附录 E 中 我 们 找到 了 字符 Z 的 ASCII 码 是 
01011010， 用 十 六 进 制 记 数 法 表达 为 5A。 这 三 条 指令 的 序列 
And #$FF000000, RO 
Compare #$5A000000, RO 
Branch=0 YES 
实现 了 所 期 望 的 动作 。And 指 令 将 RO 中 右边 三 个 字符 清 0， 而 使 最 左边 的 字符 不 变 。 这 是 使 用 一 
个 立即 源 操 作 数 的 结果 ， 读 操作 数 的 左 端 有 8 位 是 1， 后 面 的 24 位 是 0。 比较 指令 Compare 用 字符 Z 
的 二 进 制 表示 形式 同 R0 中 左 端 的 剩余 字符 进行 比较 。 如 果 有 相 苞 配 的 值 ，Branch 指 令 产 生 一 个 
转向 YES 的 转移 指令 。 
And 指 令 经 常用 在 当 一 个 操作 数 中 除了 一 些 特殊 区 域 ， 所 有 的 位 都 要 清 为 0 的 实际 程序 设计 
任务 中 。 在 我 们 的 例子 里 ，R0 中 最 左边 8 位 构成 了 特殊 的 区 域 。 


2.10.2 移 位 和 循环 移 位 指令 


有 很 多 应 用 需要 将 一 个 操作 数 的 位 向 左 或 向 右 移动 一 些 指定 数量 的 位 。 这 个 移动 过 程 如 何 
被 执行 ， 取 决 于 操作 数 是 一 个 有 符号 数 或 者 是 一 般 普 通 二 进 制 码 信息 。 对 于 一 般 的 操作 数 ， 我 
们 使 用 逻辑 移 位 。 对 于 一 个 数字 ， 我 们 使 用 算术 移 位 ， 算 术 移 位 可 以 保护 该 数字 的 符号 不 变 。 
” 逻辑 移 位 


需要 两 种 逻辑 移 位 指令 ， 一 个 是 左 移 (LShifL )， 另 一 个 是 右 移 (LShiftR )。 这 些 指令 将 一 


个 操作 数 移动 一 定数 量 的 位 ， 这 个 移动 数量 值 由 在 该 指令 中 的 一 个 计数 操作 数 说 明 。 一 个 逻辑 
左 移 指令 的 一 般 形式 为 : 


LShiftL count, dst 


计数 操作 数 可 以 作为 一 个 立即 操作 数 给 出 ， 或 者 可 以 作为 处 理 器 寄存 器 的 内 容 给 出 。 为 了 完善 
左 移 操作 的 描述 ， 我 们 需要 指明 目的 操作 数 右 边 空 出 位 的 值 ， 并 确定 在 左 端 移出 的 位 上 发 生 了 
什么 。 空 出 的 位 置 用 0 填充 ， 并 且 移出 的 位 经 过 进位 标志 C， 然 后 再 丢弃 。 将 C 标 志 一 起 参与 移 位 ， 
这 在 执行 算术 操作 时 一 个 大 数 占用 了 比 一 个 字 还 要 多 的 位 置 时 是 有 用 的 。 图 2-30a 给 出 了 一 个 例子 ， 
它 将 寄存 器 R0 的 内 容 左 移 两 位 。 逻 辑 右 移 指令 LShiftR 除 了 向 右 移 以 外 ， 其 他 工作 方式 是 相同 的 。 
图 2-30b 说 明了 这 种 操作 。 

数字 打包 举例 

考虑 以 下 的 小 任务 ， 它 说 明了 移 位 操作 和 逻辑 操作 的 用 法 。 假 设 两 个 ASCII 码 表示 的 十 进 制 
数 存 储 在 内 存单 元 字 节 LOC 和 LOC+1 中 。 我 们 希望 将 这 些 十 进 制 数 用 4 位 BCD 码 表示 ， 并 将 它们 
存放 到 一 个 单字 节 单元 PACKED 中 。 上 述 的 结果 是 要 形成 打包 BCD 码 格式 。 附 录 E 中 的 表 E-1 和 E-2 
给 出 了 十 进 制 数 ASCI 码 相应 于 这 个 数 的 BCD 码 最 右边 的 四 位 数 。 因 此 ， 所 需 的 任务 是 在 LOC 和 
LOC+1 中 提取 出 低 4 位 的 内 容 ， 然 后 将 它们 拼接 成 一 个 单字 节 放 在 PACKED 中 。 
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— Jo 


zw: [9] 
Pini 


a) 逻辑 左 移 I LShiftL #2,RO 





p 加 
2 后 口 
b) 逻辑 右 移 LShift #2,RO 
Loe 
zw 加 
> 口 
JEREB AShift #2,R0 


图 2-30 逻辑 和 算术 移 位 指令 


-图 2-31 给 出 的 指令 序列 完成 这 个 任务 ， 它 用 寄存 器 RO 作为 指向 内 存 中 ASCII 码 字符 的 指针 ， 

并 用 寄存 器 R1 和 R2 生 成 BCD 数 字 码 。 当 一 个 MoveByte 指 令 在 存储 器 和 32 位 处 理 器 寄存 器 之 间 传 
， 递 一 个 字 节 时 ， 我 们 将 这 个 字 节 安排 到 寄存 器 的 最 右边 8 位 上 。And 指 令 用 于 屏 项 R2 中 最 右边 的 四 
位 。 注 意 ， 立 即 源 操 作 数 被 写成 $SF， 将 它 作为 一 个 32 位 的 模式 解释 ， 其 主要 的 有 效 位 上 有 28 个 0。 


Move #LOC,R0 RO 指向 数据 ` 
MoveByte (RO)+,R1 将 第 一 个 字 节 载 人 人 R1 
LShiftL #4,R1 £= ` 

MoveByte  (RO0),R2 将 第 二 个 字 节 载 入 R2 


And #$F,R2 清除 高 序 位 
Or RI R2 连接 BCD 数 
MoveByte R2,PACKED ”保存 结果 





图 2-31 一 个 对 两 个 BCD 数 打包 的 程序 
算术 移 位 
图 2-1 中 补 码 的 二 进 制 数 表示 法 表明 将 一 个 数 向 左 移 动 一 位 就 等 于 这 个 数 乘 以 2; 而 向 右 移动 
一 位 等 于 这 个 数 除 以 2。 当 然 ， 在 左 移 时 可 能 会 产生 溢出 ， 而 右 移 时 余数 可 能 会 被 丢失 。 另 一 个 
要 注意 的 是 在 右 移 中 符号 位 在 对 空位 进行 填充 时 必须 要 重 写 。 这 需要 在 右 移 处 理 中 将 算术 移 位 
与 逻辑 移 位 加 以 区 别 ， 在 逻辑 移 位 中 总 是 用 0 做 空位 填充 。 没 有 这 些 的 话 ， 这 两 种 移 位 是 非常 相 
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似 的 。 在 图 2-30c 中 给 出 了 一 个 算术 右 移 AShiftR 的 例子 ， 算 术 左 移 与 逻辑 左 移 是 完全 相同 的 。 

循环 移 位 操作 | 

在 移 位 操作 中 , 除了 最 后 一 个 移出 位 保存 在 进位 标识 C 中 以 外 , 操作 数 的 移出 位 都 被 丢掉 了 。 
为 了 保留 所 有 的 位 ， 可 以 使 用 一 套 循环 指令 。 它 们 将 操作 数 一 端 移出 的 位 返回 到 操作 数 的 另 一 
端 。 通 常 提供 循环 左 移 和 循环 右 移 两 种 版 本 。 在 一 种 版 本 里 ， 操 作 数 的 位 被 简单 地 进行 循环 。 
在 另 一 种 版 本 里 ， 循 环 中 包括 了 C 标 志 。 图 2-32 给 出 了 C 标 志 包 含 或 不 包含 在 循环 中 的 循环 左 移 
和 循环 右 移 操作 。 要 注意 的 是 ， 当 循环 中 不 包括 C 标 志 时 ， 它 仍然 保留 着 寄存 器 昆 部 的 最 后 一 个 
移出 位 。 助 记 符 RaotateL 、ReotateLC、RotateR 和 RotateRC 表 示 执 行 循环 移 位 操作 的 指令 。Rotate 


指令 主要 用 于 执行 算术 运算 的 算法 过 程 中 ， 而 不 是 完成 加 法 和 减法 ， 有 关 这 点 我 们 将 在 第 6 章 中 


再 次 谈 到 。 
~ 一 SE RO -| 


zw [0] 
zi: E] 


a) 不 含 进位 标志 的 循环 左 移 RotateL #2,R0 


m 村 -| RO m 
之 前 : [6] 
>r: [1] 


b) 包含 进位 标志 的 循环 左 移 RotateLC #2,R0 








c) 不 含 进位 标志 的 循环 右 移 RotateR #2,R0 


之 后 [1 00 11 10 : + + O 


D 包含 进位 标志 的 循环 右 移 RotateRC #2,P0 
图 2-32 循环 移 位 指令 
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2.10.3 乘法 和 除法 
两 个 有 符号 整数 能 够 使 用 机 器 指令 像 用 Add 指 令 一 样 的 方式 进行 乘 或 除 。 指 令 
Multiply Ri, Rj 
执行 的 操作 为 : 
Rj- [Ri] x [RA 


两 个 "位 数 的 乘积 可 以 是 2 位 大 的 数 。 因 此 ， 答 案 肯 定 不 能 放 进 Rj 中 。 大 多 数 指令 系统 中 有 一 个 
乘法 指令 ， 它 计算 乘积 的 低 "位 并 把 它 放 在 寄存 器 Rj 中 ， 就 像 说 明 的 那样 。 如 果 已 知 在 一 些 特殊 
的 应 用 任务 中 所 有 乘积 都 将 是 不 超过 "位 的 数 ， 这 是 足够 的 。 为 了 适应 一 般 的 2 位 科 积 的 情况 ， 
一 些 处 理 器 将 乘积 生成 在 两 个 寄存 器 中 ， 通 常 是 相 邻 的 寄存 器 Rj 和 R (j+ 1 )， 其 中 高 位 部 分 放 在 
寄存 器 R(j+ 1 ) 中 。 
虽然 不 是 所 有 的 ， 但 有 些 指 令 系统 还 提供 了 一 个 有 符号 整数 的 除法 (Divide) 指令 
Divide Ri, Rj 
它 执行 的 操作 是 : 
Rj- [RA/ [Ri] 
把 得 到 的 商 放 到 Rj 中 。 余 数 可 以 放 在 R (Jj+ 1 ) 中 ， 或 着 可 以 丢掉 。 
对 于 没有 乘法 和 除法 指令 的 计算 机 ， 可 以 用 一 些 基本 的 指令 序列 比如 加 (Add)、 减 
(Subtract), Ef (Shift) 和 循环 移 位 (Rotate) 来 完成 这 些 以 及 其 他 的 算术 操作 。 当 我 们 在 第 6 
章 中 描述 算术 操作 的 实现 时 ， 这 些 将 会 变 得 更 清楚 。 


2.11 实例 程序 


在 这 一 节 里 ， 我 们 给 出 三 个 例子 来 进一步 说 明 机 器 指令 的 使 用 。 这 些 例 子 代表 了 数字 的 
(向 量 处 理 ) 和 非 数字 的 (排序 和 链表 操作 ) 的 应 用 。 


2.11.1 向 量 点 积 程序 


第 一 个 例子 是 有 关于 数字 的 应 用 ， 它 是 图 2-16 用 于 加 数 的 循环 程序 的 一 个 扩展 格式 。 在 计算 
中 包括 了 向 量 和 矩阵 ， 它 对 于 计算 两 个 向 量 的 点 积 通常 是 必要 的 。 假 设 A 和 B 是 两 个 长 度 为 4 的 向 
量 。 它 们 的 点 积 被 定义 为 : 


Dot Product = $Y A(i)x BG) 
i=0 


图 2-33 给 出 了 一 个 计算 点 积 并 把 它 储存 到 内 存单 元 DOTPROD 中 的 程序 。 每 个 向 量 的 第 一 个 元 素 
A(0) 和 B(0) 被 储存 到 内 存单 元 AVEC 和 BVEC 中 ， 其 余 的 元 素 就 储存 在 随后 的 字 单 元 中 。 

这 种 乘积 累加 和 的 任务 常 出 现在 信号 处 理 的 许多 应 用 中 。 在 这 种 情况 下 ， 其 中 的 一 个 向 量 
由 最 近 的 n 个 信号 采样 组 成 ,这 些 信号 采样 是 按照 输入 到 信号 处 理 单元 的 连续 有 时序 完成 的 。 另 一 
个 向 量 是 "个 权重 的 集合 。z 个 信号 采样 值 乘 以 这 个 权重 ， 而 这 些 乘积 的 总 和 组 成 了 一 个 输出 信 
号 实例 。 

有 些 计 算 机 指令 系统 将 图 2-33 程 序 中 的 乘法 和 加 法 指令 操作 结合 起 来 ， 成 为 一 个 单独 的 
MoultiplyAccumulate 指 令 。 在 第 3 章 的 ARM 处 理 器 中 将 会 看 到 这 样 的 一 个 例子 。 
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Move #AVEC,RI RI EA 

Move #BVEC,R2 R2 指 向 向 量 B 

Move NR3 R3 作 为 计数 器 
Clear RO RO 累加 点 积 


Move (R1)+,R4 Ri. i 
Multiply (R2)+R4 计算 下 组 元 素 的 积 


Add R4,R0 累加 到 前 面 的 和 中 
Decrement R3 减 小 计数 器 
Branch>0 LOOP 如 果 没 有 完成 再 次 循环 
Move RO,DOTPROD 将 点 积 保存 到 内 存 中 





图 2-33 计算 两 个 向 量 点 积 的 程序 


2.11.2 字 节 排序 程序 


考虑 将 一 个 存储 在 内 存 中 的 字 节 列 表 分 拣 成 按 字 母 升 序 排序 的 方式 。 假 设 这 个 列表 由 nm 个 字 
节 构 成 ,但 这 不 是 严格 的 ， 并 且 在 每 个 字 节 包含 字母 表 A 到 2Z 字 符 的 ASCII 码 。 参 见 附录 E， 在 
ASCI 码 中 字母 A, B, …, Z 用 7 位 模式 表示 ， 当 这 种 模式 作为 二 进 制 数 解释 时 其 值 是 逐渐 递增 的 。 
当 一 个 ASCH 码 字符 被 储 存在 一 个 字 节 单元 时 ， 按 照 惯例 把 最 高 有 效 位 的 位 置 设置 成 0。 使 用 这 
种 编码 ， 我 们 可 以 采用 将 它们 的 编码 按 递增 数字 顺序 排序 的 方法 来 分 拣 一 个 按 字 母 排序 的 字符 
表 ， 将 字符 编码 都 看 成 正 数 。 

将 这 张 表 保存 在 内 存单 元 LIST 到 LIST + - 1 中 ,并 且 将 n 作 为 一 个 32 位 的 值 储存 在 地 址 N 中 。 
分 拣 工作 在 原来 位 置 上 完成 ， 也 就 是 说 ， 分 拣 后 的 表 与 该 原 表 占 据 着 同一 部 分 的 内 存单 元 。 

我 们 用 一 个 直接 选择 排序 算法 对 该 表 进 行 分 类 。 首 先 ， 找 出 最 大 的 数值 并 将 它 放 到 表 的 尾部 
位 置 LIST +n ~ 1 中。 然后 再 把 在 剩 下 的 n 一 1 个 数字 子 表 中 的 最 大 数 放 在 子 表 的 末端 位 置 LIST + n— 2 
中 。 这 个 处 理 过 程 重复 直到 这 个 表 被 分 拣 完成 。 使 用 这 种 分 拣 算法 的 -一 个 C 语 言 程序 在 图 2-34a 中 
给 出 ， 在 该 程序 中 这 个 列表 被 当 作 一 个 从 LIST(O) 到 LISTCw - 1) 的 一 维 数组 。 对 于 每 个 LIST ( ; ) 到 
LIST (0 ) 的 子 表 来 讲 ，LIST (7 ) 里 的 数 与 该 子 表 中 的 其 他 数 进行 比较 。 每 当 在 子 表 中 找到 一 个 较 大 
的 数 时 ， 它 就 与 表 LIST () ) 中 的 数 进行 交换 。 

这 个 C 语 言 程序 向 后 遍历 该 列表 。 这 种 遍历 调整 方式 简化 了 机 器 语言 版 本 的 程序 中 循环 结束 
过 程 ， 因 为 是 当 变 址 值 被 碱 为 0 时 循环 退出 并 结束 的 。 

在 图 2-34b 中 给 出 了 一 个 实现 这 种 排序 算法 的 汇编 语言 程序 。 程 序 中 的 注释 解释 了 各 种 寄存 
器 的 用 法 。 当 前 的 最 大 值 保存 在 寄存 嚣 R3 中 直到 有 一 个 子 表 被 扫描 。 如 果 发 现 一 个 更 大 的 值 ， 
就 用 它 与 RB3 中 的 值 做 交换 并 把 新 的 最 大 值 储 存 到 LIST (j ) 中 。 

在 这 两 个 程序 中 为 了 提高 效率 ， 使 用 汇编 语言 程序 时 其 控制 流 的 处 理 方法 是 不 同 的 。 在 C 语 
言 程序 中 使 用 术 zhen 控 制 语句 ， 如 果 LIST (k)> LIST (j ) 时 ， 使 得 第 三 行 的 then 子 句 完成 LIST (k) 
FILIST (7 ) 的 交换 。 在 汇编 语言 程序 中 ， 转 移 发 生 在 如 果 LIST (k)< LIST (j) 成 立时 的 四 条 交换 
代码 指令 附近 。 

如 果 本 机 器 指令 系统 允许 传送 操作 可 以 从 一 个 存储 单元 直接 到 另 一 个 存储 单元 时 ， 则 在 图 
2-34b 中 内 部 循环 的 四 条 交换 代码 指令 可 以 用 三 条 指令 序列 取代 : 

MoveByte (RO, R2), (RO, R1) 
MoveByte R3, (RO, R2) 
MoveByte (RO, Rİ), R3 





Booo: Y ORF 


就 像 我 们 将 在 第 3 章 中 看 到 的 那样 ，68000 处 理 器 就 有 这 样 的 能 力 。 
最 后 注意 到 图 2-34b 中 的 程序 ， 只 有 当 列 表 中 至 少 有 两 个 元 素 时 才能 正确 地 运行 ， 因 为 对 循 
环 终止 的 检测 是 在 每 个 循环 的 最 后 进行 的 。 因 此 ， 不 管 "的 值 是 多 少 都 至 少 通过 了 一 遍 的 循环 。 


fr (¿= n-i; j> 0; j= j-1 
{for (k= j-1;k>=0k=k-1) 
[if (LIST[k] > LIST[;]) 
{ TEMP = LIST[K]; 


LIST[K] = LISTU]; 
LIST[ 站 = TEMP; 
) 






a) C 语 言 排序 程序 


Move #LIST,RO 将 LIST 载 入 R0 
Move NRI 初始 化 外 部 循环 变 址 
Subtract #1,R1 . 将 寄存 器 R1 值 设 为 /=n 一 1 
Move RLR2 初始 化 内 部 循环 变 址 
Subtract #1,R1 将 寄存 器 R2 的 值 设 为 k=j- 1 
MoveByte (RO,R1),R3 ' 将 LIST(7 ) 载 人 R3，R3 保 存 
当前 子 列表 的 最 大 值 
CompareByte  R3,(RO,R2) 如 果 LIST(k)< [R3] 不 交换 
Branch <0 NEXT 
MoveByte (R0,R2),R4 
MoveByte R3,(R0,R2) 


否则 ， 交 换 LIST(& ) 和 LIST(j ) 
并 将 新 最 大 值 载 人 R3 

MoveByte R4,(RO,RI) 寄存 器 R4 作 为 TEMP 

Decrement 减 小 变 址 寄存 器 R2 和 R1， 它 们 

Branch>0 也 作为 循环 计数 器 ， 当 循环 尚未 

Decrement 结束 时 转移 回去 


Branch>0 


b) 汇编 语言 排序 程序 
图 2-34 使 用 直接 选择 算法 的 字 节 排序 程序 


2.11.3 链表 


许多 非 数 字 的 应 用 程序 需要 一 个 存储 在 内 存 中 表示 信息 项 的 顺序 表 ， 在 这 种 方式 中 很 可 能 
要 完成 在 表 的 任意 位 置 上 添加 项 或 是 从 表 中 删除 项 ， 而 仍然 能 维护 所 需要 项 的 顺序 。 这 与 2.8 节 
中 讨论 的 堆栈 和 队列 数据 结构 相 比 是 一 种 更 一 般 的 情况 ， 在 堆栈 和 队列 的 数据 结构 中 只 能 在 数 
据 结构 的 两 端 进行 添加 和 删除 。 考 虑 以 下 的 例子 ， 在 2.5 节 中 用 来 说 明 变 址 寻 址 模式 的 学 生 课程 
成 绩 表 中 包含 一 个 具有 惟一 性 的 学 生 ID 号 ， 这 个 ID 号 是 每 个 学 生 记 录 中 四 个 字 中 的 第 一 个 字 ， 
如 图 2-14 所 示 。 假 设 我 们 试图 以 学 生 号 递增 顺序 、 按 相 邻 的 内 存 块 、 以 连续 的 存储 单元 来 维护 
这 张 记录 表 。 这 样 做 可 以 使 利用 ID 号 来 打印 和 邮寄 考试 成 绩 记 录 表 的 工作 变 得 容易 一 些 。 在 该 
表 被 建成 以 后 ， 如 果 有 某 个 学 生 从 课程 中 退出 ， 就 会 产生 一 条 空 记录 的 位 置 。 当 需要 对 所 有 记 
录 做 考试 分 数 的 累加 或 是 需要 打印 出 一 张 表 时 ， 就 需要 跳 过 这 条 空 记录 。 在 这 张 表 的 初始 结构 
建立 后 如 果 又 有 一 个 学 生 注 册 了 这 门 课程 ， 就 会 出 现 一 种 比较 乾 舱 的 情况 。 为 了 保持 该 列表 的 
顺序 ， 所 有 的 记录 中 从 第 一 个 比 新 的 ID 号 大 的 记录 开始 ， 需 要 移 到 高 一 些 的 地 址 单元 中 去 ， 为 
新 的 记录 创建 一 个 四 字 长 的 空间 。 类 似 地 ， 当 对 以 前 有 过 的 学 生 信息 做 撤销 处 理 时 ， 由 于 空位 
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置 的 原因 也 要 做 移动 ， 而 这 个 移动 要 对 这 个 空位 以 后 的 所 有 记录 完成 向 低地 址 单元 移动 的 操作 
才能 弥补 这 个 空缺 。 | 

链表 的 数据 结构 可 以 用 来 避免 这 两 种 问题 。 在 链表 中 每 条 记录 仍然 占有 内 存 中 一 个 连续 的 
四 字 长 的 块 ， 但 在 顺序 上 连续 的 记录 没有 必要 占用 连续 的 内 存 地 址 空间 块 。 为 了 将 这 些 块 连接 
在 一 起 形成 一 个 顺序 表 ， 每 条 记录 中 包含 一 个 一 字 长 的 链接 字段 的 地 址 值 ， 它 具体 指出 该 顺序 
中 下 一 条 记录 的 具体 位 置 ， 因 此 链表 可 以 用 来 描述 这 种 数据 结构 。 关 于 一 个 链表 的 图 表 说 明 在 
图 2-35a 中 给 出 。 这 个 表 中 的 第 一 条 记录 叫做 表 头 ， 最 后 一 条 记录 叫做 表 尾 。 


链接 地 址 


=] Tee [3-4 == T°] 


a) 链表 结构 





b) 在 记录 1 与 记录 2 之 间 插入 一 条 新 记录 


图 2-35 链表 数据 结构 


为 了 在 记录 i 和 i + 1 之 间 播 人 一 条 新 记录 ， 记 录 ;i 中 的 链接 地 址 拷贝 到 新 记录 的 链接 字段 中 ， 
然后 新 记录 的 地 址 写 到 记录 i 的 链接 字段 中 。 这 个 操作 在 图 2-35b 中 给 出 了 图 示 。 为 了 删除 记录 i， 
i 的 链接 字段 地 址 被 拷贝 到 记录 i - 1 的 链接 字段 中 。 
图 2-36 给 出 了 学 生 考试 成 绩 记 录 在 存储 器 中 链接 起 来 的 例子 ， 它 的 顺序 是 按 递增 的 ID 号 排列 
的 。 每 条 记录 现在 是 五 个 字 长 ， 第 一 个 字 作为 关键 字段 定义 ， 其 中 包含 着 学 生 的 ID 号 。 第 二 个 
字段 包含 的 内 容 是 链接 字段 ， 最 后 三 个 字段 是 数据 字段 ， 其 中 包含 着 三 个 考试 成 绩 。 假 定 字 长 
是 32 位 ， 起 始 字 地 址 在 1000 处 的 存储 器 中 的 2000 个 字 节 空 间 ， 被 分 配 用 来 保存 每 个 学 生 的 五 字 
长 记录 ， 每 条 记录 有 20 个 字 节 ， 最 多 有 100 个 学 生 。 当 学 生 注 册 课程 时 ， 在 内 存 中 分 配 一 个 可 获 
得 的 五 字 长 记录 块 。 按 照 块 地 址 顺序 1000, 1020, 1040, …, 2980 进 行 分 配 可 能 是 方便 的 ， 但 并 不 是 
必需 的 。 在 学 生 的 ID 号 之 间 和 学 生 对 于 课程 注册 顺序 之 间 没 有 特殊 的 关联 关系 。 因 此 记录 块 的 
位 置 、 学 生 ZP 号 的 顺序 将 以 一 种 不 可 预测 的 方式 在 块 地 址 1000 到 块 地 址 2980 之 间 指 定 的 存储 空 
间 中 散布 着 。 
具有 当前 最 低 ID 号 的 记录 居于 该 表 的 表 头 ， 而 具有 当前 最 高 ID 号 的 记录 是 在 表 的 尾部 。 访 
问 这 个 表 的 一 种 方便 方法 是 将 表 头 的 存储 地 址 〈 这 里 是 2320)， 保 存 到 处 理 器 的 头 指针 寄存 器 中 。 
第 一 条 记录 的 链接 字段 中 的 地 址 1040 用 于 指明 第 二 条 记录 的 位 置 。 第 二 条 记录 的 链接 字段 包含 
着 第 三 条 记录 的 地 址 1200 等 。 最 后 一 条 记录 的 链接 字段 设置 成 0， 说 明 这 是 该 表 的 表 尾 记录 项 。 
如 果 这 个 表 是 空 的 ， 头 指 针 中 的 内 容 为 0。 
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存储 器 ”关键 字段 ”链接 字段 数据 字段 
地 址 (ID) (成 绩 ) 
1 个 字 F 3 个 字 

第 一 条 2320 | 27243 表 头 
记录 _ 
第 二 条 
记录 
fa [æm | | l | 
人 


nE ao mo [= Las] 
2720 40632 | 1280 


第 二 条 记录 — 





最 后 -条 


a Lom o | J Í |x 


图 2-36 学 生 考试 成 绩 表 作为 一 个 链表 在 存储 器 中 的 结构 

插入 一 条 新 记录 

现在 给 出 当 需 要 将 一 条 新 记录 添加 到 图 2-36 所 示 的 表 中 的 步骤 。 假 定 这 条 新 记录 的 ID 号 是 
28241， 而 下 一 条 可 获得 的 空闲 记录 块 在 地 址 2960 处 ， 从 头 记录 开始 向 前 追踪 直到 找到 一 条 具有 
更 大 ID 号 的 记录 为 止 。 这 里 是 存储 单元 1200 中 的 记录 ， 它 包含 的 ID 号 是 28370。 现 在 将 链接 地 址 
1200 插 入 到 新 记录 的 链接 字段 中 ， 然 后 将 新 记录 的 地 址 2960 插 入 到 在 单元 1040 中 的 前 一 条 记录 
的 链接 字段 中 ， 和 覆盖 原 有 的 值 1200。 现 在 新 记录 已 经 被 插入 到 了 修改 表 的 第 三 条 记录 中 ， 在 原 
来 表 的 第 二 条 和 第 三 条 记录 之 间 。 

完成 插入 操作 的 子 程序 在 图 2-37 中 给 出 。 它 由 三 部 分 构成 ， 用 来 处 理 以 下 三 种 可 能 情况 ， 当 
前 表 是 空 的 ， 或 者 这 条 新 记录 变 成 了 非 空 表 的 新 表 头 ， 或 者 新 记录 插入 到 该 表 的 当前 头 记录 后 
面 的 某 处 位 置 上 。 最 后 一 种 情况 包含 着 新 记录 变 成 表 尾 的 情况 。 

现在 考虑 该 子 程序 如 何 处 理 这 三 种 可 能 情况 。 该 子 程序 使 用 了 多 个 处 理 器 寄存 器 。 为 了 替 
换 常用 名 字 R0、R1、R2 等 ， 我 们 用 更 具有 描述 性 的 名 称 来 帮助 理解 。RHEAD 是 头 指针 ， 
RNEWREC 包 含 着 新 记录 的 地 址 。 两 个 寄存 器 RCURRENT 和 RNEXT 包 含 着 当 扫描 该 表 找到 用 于 
插入 新 记录 的 正确 位 置 的 当前 记录 和 下 一 条 记录 的 地 址 。 新 记录 的 链接 字段 最 初 设置 成 0。 如 果 
它 变 成 了 新 的 表 尾 ， 这 个 字段 不 需要 进一步 改变 。 

第 一 个 比较 /转移 指令 检测 该 表 是 否 为 空 ， 如 果 它 是 个 空 表 (RHEAD 的 内 容 为 0)， 将 该 记录 
的 地 址 移 到 RHEAD 中 ， 使 新 的 记录 变 成 了 一 个 表 项 的 列表 ， 后 面 紧 跟着 一 个 Retum 指 令 ， 否 则 ， 
第 二 个 比较 /转移 指令 检查 是 否 新 的 记录 变 成 了 表 头 。 如 果 是 ， 两 个 Move 指 令 完 成 所 需要 的 将 新 
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记录 链接 字段 和 RHEAD 中 内 容 进行 改变 的 工作 ， 然 后 执行 Return 指 令 。 如 果 新 记录 不 是 新 的 表 
头 ， 子 程序 的 后 半 部 分 确定 在 该 表 中 何 处 是 新 记录 将 要 被 插入 的 位 置 。 然 后 用 最 后 的 两 个 Move 
首 令 将 它 插入 到 平 确 的 内 部 位 置 中 ， 或 是 用 最 后 的 一 个 Move 指 令 生成 新 的 表 尾 。 为 了 改善 易 读 
性 和 对 播 入 操作 理解 ， 我 们 省 略 了 在 这 个 子 程序 中 保存 和 恢复 寄存 器 的 过 程 。 


INSERTION Compare #0, RHEAD 
- Branch>0 HEAD B 
L, Move RNEWREC, RHEAD 新 记录 成 为 一 
A ”个 表 项 的 列表 
i Return 
ww HEAD Compare (RHEAD), (RNEWREC) 
Move RHEAD, 4(RNEWREC) ， 新 记录 成 为 
Move RNEWREC, RHEAD ”新 表 头 
Return 
Lom SE ARCH Move RHEAD, RCURRENT 
LOOP Move 4(RCURRENT), RNEXT 
Compare #0, RNEXT 
新 记录 成 为 新 表 屁 Compare (RNEXT), (RNEWREC) 


在 当前 表 头 后 的 
某 处 插入 新 记录 


看 链 表 内 部 插入 Move RNEXT RCURRENT 

| 7 -条 新 记录 Branch LOOP 

| L- s INSERT Move RNEXT, 4(RNEWREC) 

bamm TAIL Move RNEWREC, 4(RCURRENT) 
Return 





图 2-37 用 于 将 新 记录 插入 到 一 个 链表 中 的 子 程序 

删除 一 条 记录 

从 一 个 链表 中 删除 一 条 已 存在 的 记录 比 插入 一 条 新 记录 的 操作 要 容易 。 我 们 连续 简单 地 查 
询 这 个 表 ， 直 到 找到 这 个 将 要 被 删除 记录 的 呈 ， 然 后 进行 所 需要 的 链接 字段 的 调整 。 图 2-38 给 出 
了 实现 这 种 删除 操作 的 子 程序 。 假 设 寄存 器 RIDNUM 中 包含 着 将 要 被 删除 记录 的 ID。 寄 存 器 
RHEAD、RCURRENT 和 RNEXT 扮 演 着 如 同 在 插入 子 程序 中 同样 的 角色 。 第 一 个 比较 /转移 指令 
检测 将 要 被 删除 的 记录 是 否 是 表 头 ， 如 果 是 ， 将 该 头 记 录 中 的 链接 字段 地 址 移 人 到 RHEAD 中 ， 
将 该 记录 删除 。 要 注意 的 是 ， 如 果 这 个 头 是 该 表 中 的 惟一 记录 ， 则 它 的 链接 字段 包含 的 内 容 是 0， 
表示 它 同时 也 是 表 尾 ， 所 以 将 0 移 到 RHEAD 中 正好 表示 空 表 的 情况 。 如 果 头 记录 不 是 将 要 被 删除 
的 记录 ， 则 转移 到 SEARCH。 这 上 时， 寄存器 RCURRENT 和 RNEXT 用 来 完成 前 向 检索 ， 从 头 开始 
直到 所 需要 的 记录 被 找到 。 当 所 需要 的 记录 被 第 二 个 比较 /转移 指令 对 找到 后 ， 程 序 的 执行 将 转 
到 DELETE 处 。 将 这 条 被 RNEXT 指 出 的 记录 的 链接 字段 改变 为 前 一 条 记录 的 链接 字段 ， 即 由 
RCURRENT 指 出 的 记录 ， 这 样 这 条 记录 就 被 删除 了 。 最 后 两 个 Move 指 令 实现 了 通过 寄存 器 
RIEMP 的 迁移 。 如 果 存 储 器 到 存储 器 的 Move 指 令 是 允许 的 ， 则 单 指令 

Move 4(RNEXT ), 4 ( RCURRENT ) 

可 以 蔡 换 这 两 个 Move 指 令 。 
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DELETION Compare (RHEAD), RDNUM 
ee Branch>0 SE ARCH 
Move 4(RHEAD) RHEAD 
Return 
Move RHEAD, RCURRENT 
Move 4(RCURRENT), RNEXT 
Compare (RNEXT), RIDNUM 
Branch=0 DELETE 
Move RNEXT, RCURRENT 
Branch LOOP 
Move 4(RNEXT), RTEMP 
Move RTEMP, 4(RCURRENT) 
Return 


韭 表 头 记录 





图 2-38 从 链表 中 删除 一 条 记录 的 子 程序 


错误 条 件 

在 图 2-37 和 图 2-38 中 的 插入 和 删除 子 程序 没有 考虑 两 种 可 能 的 错误 条 件 ， 插 入 子 程序 可 能 磁 
到 这 样 一 种 假定 的 情况 ， 在 列表 中 已 经 有 一 个 与 新 记录 的 ID 号 相同 的 记录 ; 而 删除 子 程序 可 能 
会 磁 到 在 表 中 给 出 的 ID 号 记录 已 经 被 删除 。 在 习题 2.23 和 2.24 中 考虑 修改 这 些 子 程序 ， 使 它们 可 
以 处 理 这 些 可 能 发 生 的 错误 情况 。 


2.12 机 器 指令 的 编码 


我 们 已 经 介绍 了 各 种 有 用 的 指令 和 寻 址 方式 ， 这 些 指 令 具 体 说 明了 由 处 理 器 电路 为 了 执行 
这 些 具 体 任务 时 必须 执行 的 动作 ， 通 常 将 它们 称 为 机 器 指令 。 实 际 上 ， 那 些 已 经 给 出 的 指令 格 
式 是 在 汇编 语言 中 使 用 的 格式 ， 不 包括 那些 试图 要 避免 使 用 的 用 于 各 种 操作 的 缩写 格式 ， 那 些 
操作 是 难以 记忆 的 并 且 很 可 能 是 特殊 的 商用 处 理 器 所 特有 的 。 为 了 能 够 在 一 个 处 理 器 中 执行 ， 
站 令 必 须 按照 紧缩 的 二 进 制 模式 进行 编码 。 这 些 编码 后 的 指令 才 真 正 地 称 为 机 器 指令 。 那 些 使 
用 符号 名 和 首 字母 缩写 形成 的 指令 叫做 汇编 语言 指令 ， 它 们 被 汇编 程序 转换 成 机 器 指令 ， 就 像 
在 2.6 节 中 解释 的 那样 。 

在 上 一 节 中 ， 我 们 做 了 一 个 简化 处 理 的 假设 ， 即 所 有 的 指令 是 一 个 字 长 的 。 因 为 通常 引用 
的 是 32 位 的 字 ， 这 个 假设 意味 着 该 长 度 对 于 所 需要 表示 的 信息 是 合适 的 。 现 在 来 考虑 这 种 假设 
的 有 效 性 。 

我 们 已 经 看 到 了 执行 像 加 、 减 、 传 送 、 移 位 、 循 环 和 转移 这 样 操作 的 指令 ， 这 些 指令 可 以 
使 用 不 同 大 小 的 操作 数 ， 例 如 像 32 位 和 8 位 数字 ， 或 者 8 位 ASCII 编 码 字 符 。 操 作 类 型 是 将 要 被 执 
行 的 操作 以 及 使 用 操作 数 的 类 型 ， 它 可 能 会 用 一 个 二 进 制 模式 的 编码 来 表示 ， 这 个 二 进 制 编码 
称 为 该 指令 的 操作 码 。 如 果 分 配 了 8 位 ， 就 可 以 有 256 种 用 于 说 明 不 同 指令 的 可 能 性 。 其 余 的 24 
位 说 明 所 需 信息 的 其 他 内 容 。 

让 我 们 来 考察 一 些 典型 的 情况 ， 指 令 

Add RI,R2 


除了 操作 码 以 外 ， 还 指出 了 寄存 器 R1 和 R2。 如 果 处 理 器 有 16 个 寄存 器 ， 这 时 需要 有 四 位 用 来 识 
别 不 同 的 寄存 器 。 需 要 用 附加 位 来 说 明 访 寄存 器 用 在 各 种 操作 数 中 的 寻 址 方式 。 





指令 
Move 24( RO),R5 
需要 用 16 位 来 表示 操作 码 和 两 个 寄存 器 ， 以 及 一 些 用 来 表示 使 用 变 址 导 址 方式 的 源 操作 数 的 位 ， 
这 里 变 址 值 是 24。 假 设 用 三 位 来 说 明 在 表 2-1 中 的 一 种 寻 址 方式 ， 则 用 于 这 一 目的 的 就 有 6 位 ， 它 
们 代表 源 和 目的 操作 数 寻 址 方式 选择 ， 因 此 左边 的 10 位 用 来 给 出 变 直 值 。 如 果 这 10 位 足够 用 来 
表示 用 于 变 址 的 有 符号 数 的 给 定 范围 ， 则 该 指令 可 以 放 进 32 位 的 字 中 。 
移 位 指令 
| LshiftR #2, RO 
和 数据 传送 指令 
Move #$3A,R1 
除了 用 于 说 明 操 作 码 、 寻 址 方式 和 寄存 器 的 18 位 以 外 ， 还 必须 分 别 说 明 立即 数 2 和 $3A。 这 就 将 
立即 操作 数 的 大 小 限定 在 14 位 的 范围 之 内 。 
考虑 以 下 的 转移 指令 : 
Branch > 0 LOOP 
我 们 再 一 次 用 8 位 作为 操作 码 ， 其 余 的 24 位 用 来 说 明 转移 的 偏 移 量 。 由 于 偏 移 量 是 一 进 制 补 码 数 ， 
转移 目标 地 址 必须 是 在 转移 指令 所 在 位 置 的 22 字 ; | 
节 以 内 。 为 了 转移 到 这 个 范围 以 外 的 一 个 指令 上 ， —— 
必须 使 用 不 同 的 寻 址 方式 ， 比 如 像 直接 寻 址 或 是 [wa [< [as | Ses 1 
寄存 器 间接 寻 址 等 。 使 用 这 些 方式 的 转移 指令 通 


EI (Jump) 指令 。 G. S 

在 所 有 这 些 例子 中 ， 指 令 可 以 在 一 个 32 位 的 O hm | 涛 | Bi 其 他 信息 
字 中 进行 编码 。 图 2-39a 描 述 了 一 种 可 能 的 形式 。 [一 一 一 一 一 一 一 一 一 一 一 
这 里 有 一 个 8 位 的 操作 码 字段 以 及 两 个 7 位 的 用 来 To | 
说 明 源 和 目的 操作 数 的 字段 。7 位 字段 用 来 识别 DREEF 


寻 址 方式 以 及 相关 的 寄存 器 (如果 有 的 话 )。“ 其 aa 
他 信息 ”字段 可 以 用 来 指明 那些 可 能 需要 的 附加 | ane | = | DE ritig 


F 


| 


信息 ， 比 如 一 个 变 址 值 或 是 一 个 立即 操作 数 。 L S 
但 是 如 果 试 图 使 用 绝对 寻 址 方式 指明 一 个 内 9 “操作 数 指令 
存 操作 数 时 会 出 现 什么 情况 呢 ? 指令 图 2-39 32 位 字 长 的 编码 指令 
Move R2, LOC 


需要 18 位 去 说 明 操 作 码 、 寻 址 方式 和 寄存 器 。 其 余 的 14 位 用 来 表示 与 LOC 相 对 应 的 地 址 ， 
这 显然 是 不 够 的 。 如 果 我 们 想 要 能 够 在 这 个 指令 中 给 出 一 个 完整 的 32 位 地 址 ， 惟 一 的 解决 办 法 
就 是 在 这 个 指令 中 要 包含 第 二 个 字 ， 在 这 种 情况 下 ， 添 加 的 这 个 字 可 以 保存 需要 的 存储 器 地 址 。 
这 种 对 应 的 形式 已 在 图 2-39b 中 给 出 。 第 一 个 字 可 能 与 图 中 的 a 部 分 相同 ， 第 二 个 字 完 全 是 一 个 存 
储 器 地 址 。 这 种 形式 也 可 以 适应 于 这 样 的 指令 : 
And #$FF000000, R2 


在 这 种 情况 下 ， 第 一 个 字 给 出 了 一 个 完整 的 32 位 的 立即 操作 数 。 
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如 果 我 们 想 要 人 允许 在 一 个 指令 中 的 两 个 操作 数 都 可 以 使 用 绝对 寻 址 方式 表示 ， 例 如 : 
Move LOC1, LOC2 

这 时 它 就 需要 使 用 两 个 附加 的 32 位 地 址 的 操作 数 。 

这 种 方法 产生 了 变量 长 度 的 指令 ， 其 长 度 取 决 于 操作 数 的 个 数 和 使 用 寻 址 方式 的 类 型 。 使 
用 多 个 字 ， 我 们 可 以 实现 非常 复杂 的 指令 ， 这 非常 类 似 于 高 级 程序 设计 语言 。 复 杂 指 令 集 计算 
机 (CISC) 可 以 用 于 访问 那些 使 用 这 种 指令 系统 类 型 的 处 理 器 。 

这 两 种 实现 方法 中 存在 着 一 个 根本 的 不 同 之 处 ， 如 果 我 们 坚持 所 有 的 指令 必须 安排 到 一 个 
单一 的 32 位 字 中 ， 就 不 可 能 在 指令 内 部 提供 一 个 32 位 的 地 址 或 是 一 个 32 位 的 立即 操作 数 。 但 仍 
然 是 有 可 能 定义 一 个 高 性 能 的 指令 系统 ， 它 可 以 大 量 地 使 用 处 理 器 寄存 器 。 这 样 可 以 有 


Add RI1,R2 
而 不 是 
Add LOC, R2 
作为 后 一 个 指令 的 替代 ， 我 们 可 以 使 用 
Add (R3), R2 


只 要 在 这 条 指令 执行 前 将 地 址 LOC 装 入 到 寄存 器 R3 中 即 可 。 在 这 种 情况 下 ， 寄 存 器 R3 是 作为 指 
向 所 需 存储 单元 的 一 个 指针 被 使 用 的 。 

这 就 提出 了 一 个 问题 ， 如 何 将 一 个 32 位 的 地 址 装 入 到 一 个 作为 指向 存储 单元 指针 的 寄存 器 
中 。 一 种 可 能 是 ， 汇 编程 序 直接 将 所 需要 的 地 址 放 到 靠近 程序 的 数据 区 中 的 一 个 字 单 元 中 。 然 
后 可 以 用 相对 寻 址 方式 来 装载 这 个 地 址 。 这 里 要 假定 在 Load 指令 中 包含 的 变 址 字段 足够 大 ， 可 
以 达到 保存 所 需 地 址 的 位 置 上 。 另 一 个 可 能 性 是 ， 使 用 给 出 它 足够 小 的 一 部 分 ， 并 用 逻辑 和 移 
位 指令 去 构造 所 需要 的 32 位 地 址 ， 而 这 个 小 部 分 只 要 足够 可 以 说 明 使 用 的 立即 寻 址 方式 即 可 。 
这 个 问题 在 第 3 章 对 ARM 处 理 器 的 描述 中 有 更 详细 的 阐述 。 所 有 的 ARM 指 令 都 被 编码 成 一 个 单 
独 的 32 位 字 。 

一 个 指令 只 占用 惟一 的 一 个 字 的 限制 已 经 引导 了 一 种 计算 机 风格 ， 它 就 是 众所周知 的 精简 
指令 集 计算 机 (RISC)。RISC 方 法 引入 了 另 一 种 限制 ， 比 如 所 有 的 数据 操作 必须 在 操作 数 已 经 装 
人 到 处 理 器 的 寄存 器 中 才能 完成 。 这 个 限制 意味 着 以 上 的 加 法 指令 将 需要 一 个 两 指令 的 序列 来 
完成 : 

Move (R3)R1 

Add RI,R2 
如 果 Add 指 令 只 能 指明 两 个 寄存 器 ， 那 么 它 将 只 需要 32 位 字 中 的 一 部 分 。 这 样 有 可 能 提供 一 个 更 
强大 的 使 用 三 个 操作 数 的 指令 

Add R1, R2, R3 
它 执 行 的 操作 是 : 

R3-[R1]+[R2] 
对 于 这 种 指令 的 构成 形式 在 图 2-39c 中 给 出 。 当 然 ， 处 理 器 必须 能 够 处 理 这 种 三 操作 数 的 指令 。 
在 这 样 的 指令 集中 ， 所 有 的 算术 和 逻辑 操作 只 能 使 用 寄存 器 操作 数 ， 惟 一 与 内 存 相关 联 的 操作 
是 将 操作 数 加 载 到 处 理 器 的 寄存 器 中 或 是 向 处 理 器 寄存 器 中 存储 操作 数 。 
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RISC 型 的 指令 集 与 CISC 型 的 指令 集 相 比 具 有 较 少 和 较 简 单 指令 的 特点 。 我 们 将 在 第 8 章 中 讨 
论 RISC 和 CISC 指 令 的 相关 特点 ， 它 与 处 理 器 设计 的 细节 有 关 。 


2.13 结束 语 


这 一 章 以 程序 设计 员 的 角度 介绍 了 汇编 与 机 器 级 的 程序 和 指令 的 表示 和 执行 。 在 讨论 中 强 
调 了 寻 址 技术 和 指令 序列 的 基本 原则 。 程 序 设 计 例子 说 明了 使 用 某 种 现代 计算 机 指令 系统 实现 
操作 的 基本 类 型 。 已 经 介绍 的 几 种 寻 址 方式 包括 了 指针 和 变 址 寻 址 等 重要 概念 。 已 经 讨论 的 基 
本 IO 操作 给 出 了 字符 如 何在 处 理 器 与 键盘 及 处 理 器 与 显示 设备 之 间 进 行 传递 的 方法 。 对 子 程序 
的 概念 和 实现 子 程序 需要 的 指令 也 进行 了 讨论 。 子 程序 链接 法 提供 了 堆栈 数据 结构 应 用 的 一 个 
例子 ， 还 介绍 了 机 器 指令 控制 操作 其 他 数据 结构 的 方法 。 对 于 队列 、 数 组 和 链表 也 作 了 介绍 。 
我 们 描述 了 两 种 不 同 机 器 指令 集 一 一 CISC 和 RISC 的 设计 方法 。 这 两 种 设计 方法 的 执行 时 间 性 能 
将 在 第 8 章 中 进一步 描述 。 
习题 
21 将 十 进 制 数 5S、- 2、14、- 10、26、- 19、51 和 一 43 按 以 下 的 二 进 制 方式 表示 成 有 符号 的 7 

位 数字 : 

(a) 原 码 
(b) 反 码 
(c) 补 码 

(参见 附录 E“ 十 进 制 整数 到 二 进 制 整数 的 转换 ”。 ) 

2.2 (a) 将 以 下 各 对 十 进 制 数 转 换 成 5 位 带 符号 的 补 码 形式 ， 并 且 将 它们 相 加。 判断 在 下 列 情况 中 

是 否 有 溢出 发 生 。 


(1) 5 和 10 
(2) 7 和 13 
(3) - 14 和 11 
(4) -5407 
(5) -3401-8 
(6) - 10 和 一 13 
(b) 重复 (a) 中 的 描述 ， 对 其 做 减法 操作 ， 即 第 一 个 数 碱 去 第 二 个 数 。 查 看 在 这 些 情况 中 是 否 
有 溢出 发 生 。 
2.3 在 一 些 内 存单 元 中 给 出 一 个 二 进 制 模式 ， 是 否 能 说 明 这 些 模 式 表 示 的 是 一 个 机 器 指令 还 是 
一 个 数字 ? 


2.4 一 个 字 节 存储 单元 中 包含 着 模式 00101100。 当 作为 一 个 二 进 制 数 解释 时 这 个 模式 表示 什么 ? 
作为 一 个 ASCI 码 解释 时 它 又 表示 什么 ? 

2.5 考虑 一 台 计 算 机 ， 它 有 一 个 按 字 节 寻 址 的 存储 器 ， 按 照 32 位 字 对 应 于 big-endian 策 略 组 织 方 
式 。 一 个 程序 在 键盘 上 读 人 ASCI 字 符 并 将 它们 存储 在 连续 字 节 单元 中 ,起 始 位 置 在 1000 处 。 
在 输入 名 字 “Johnson” 以 后 ， 显 示 存 储 在 单元 1000 和 1004 中 的 两 个 字 的 内 容 。 

2.6 针对 little-endian 策 略 重 复 问 题 2.5。 

2.7 一 个 程序 从 键盘 输入 中 读 和 表示 十 进 制 数 的 ASCIH 字 符 ， 并 将 这 些 字 符 存储 在 连续 的 内 存 字 
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2.8 


2.9 


2.10 


2.1 


= 


2.12 


2.13 


2.14 


2.15 


# 2 * 





节 中 。 按 照 附录 了 E 的 方式 检查 这 些 ASCII 码 并 说 明 将 每 个 字符 转换 成 相等 的 二 进 制 数 时 需要 
什么 样 的 操作 。 

写 一 段 程 序 ， 可 以 在 一 个 单 累加 器 的 处 理 器 中 计算 表达 式 

AxB+CxD 

的 值 。 假 定 读 处 理 器 有 Load、 Store. Multiply 和 Add 指令， 并且 所 有 这 些 值 都 正好 能 放 在 
该 累加 器 中 。 
将 图 2-14 中 给 出 的 学 生成 绩 表 改变 为 每 个 学 生 包 含有 j 项 考试 分 数 。 假 设 这 里 有 mn 个 学 生 。 写 
一 段 汇 编 语 言 程序 ， 计 算 在 每 项 考试 中 的 分 数 和 ， 并 且 将 这 些 和 存储 在 存储 器 的 字 单 元 
SUM、SUM+4、SUM+8、… 中 。 考 试 的 个 数 ) 比 处 理 器 的 寄存 器 可 保存 的 数字 要 大 ， 所 以 在 
图 2.15 中 给 出 的 针对 于 三 项 考试 情况 的 典型 程序 已 不 能 使 用 。 使 用 两 个 悉 套 循环 ， 就 像 在 
2.5.3 布 中 建议 的 那样 ， 内 部 循环 应 该 累计 每 个 特定 考试 的 和 ， 而 外 部 循环 应 该 在 考试 数 j 之 
上 运行 。 假 设 j 存 储 在 存储 单元 J] 中 ， 放 在 单元 N 的 前 面 。 

(a) 针对 一 个 指令 集 其 中 的 算术 和 逻辑 运算 只 适应 于 操作 数 在 处 理 器 寄存 器 中 的 情况 ， 重 
写 在 图 2-33 中 的 点 积 程序 。 两 个 指令 Load 和 Store 被 用 来 作为 寄存 器 和 存储 器 之 间 的 操作 数 
传递 。 

(b) 计算 在 表达 式 后 + kz, 中 的 常数 和 三 的 值 ， 它 表示 执行 (a) 部 分 程序 所 需 的 存储 器 访问 数 
量 ， 其 中 包括 指令 字 的 读 取 。 假 设 每 个 指令 占用 一 个 单独 的 字 。 | 

对 于 一 个 具有 二 地 址 指令 的 计算 机 ， 即 它 可 以 执行 这 样 的 操作 : 

A-[A]+[B] 

重复 2.10 中 的 问题 ， 这 里 A 和 B 可 以 是 存储 单元 也 可 以 是 处 理 器 寄存 器 。 哪 种 计算 机 需要 较 
少 的 内 存 访问 ? (第 8 章 中 的 流水 线 给 出 了 对 于 这 个 问题 不 同 观点 .) 

“具有 大 量 的 处 理 器 寄存 器 可 以 在 执行 复杂 任务 时 减少 访问 内 存 的 需求 次 数 。” 设计 一 个 
简单 的 计算 任务 ， 对 一 个 有 四 个 寄存 器 的 处 理 器 和 另 一 个 只 有 两 个 寄存 器 的 处 理 器 做 比较 ， 
证 明 这 和 句 话 的 正确 性 。 

在 一 个 计算 机 中 寄存 器 R1 和 R2 保 存 着 十 进 制 值 1200 和 4600， 在 以 下 的 各 指令 中 内 存 操作 数 
的 有 效 地 址 是 多 少 ? 

(a) Load 20(R1), R5 

(b) Move #3000, R5 

(c) Store R5, 30(R1, R2) 

(d) Add — (R2), R5 

(e) Subtract (RH +, RS 
假设 由 图 2-14 中 给 出 的 学 生 考试 成 绩 表 被 当 作 一 个 链表 存储 在 内 存 中 ， 如 图 2-36 所 示 。 写 
一 个 汇编 语言 程序 ， 它 能 完成 像 图 2-15 程 序 中 一 样 的 功能 。 头 记 录 存 储 在 内 存单 元 1000 处 。 
考虑 包含 有 A (LJ) 的 一 个 数组 ， 这 里 i (从 0 到 n ~ 1) 是 行 标志 ,， j (从 0 到 m -1) 是 列 标志 。 
这 个 数组 被 一 行 接 一 行 地 存储 在 计算 机 的 存储 器 中 ， 它 的 每 一 行 元 素 占 有 m 个 连续 的 字 单 
元 。 假 设 这 个 存储 器 是 按 字 节 寻 址 的 ， 并且 字 长 是 32 位 。 写 一 段 将 x 列 加 到 y 列 上 的 子 程序 ， 
对 应 元 素 相 加 , 将 元 素 相 加 的 和 放 在 y 列 上 。 Xx 和 和 y 的 标志 被 传送 到 子 程序 的 R1 和 R2 寄 存 器 中 ， 
参数 x 和 m 被 传递 到 子 程序 的 R3 和 R44 寄存 器 中 , 并 且 单 元 4(0， 0) 的 地 址 被 传递 到 寄存 器 RO 中 。 
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可 以 使 用 表 2-1 中 的 任何 一 种 寻 址 方式 。 最 多 一 个 指令 只 有 一 个 操作 数 可 以 在 内 存 中 。 


2.16 以 下 两 种 语句 都 可 以 使 值 300 存 储 在 单元 1000 中 ， 但 是 却 是 在 不 同 的 时 间 完 成 的 。 


ORIGIN 1000 

DATAWORD 300 
以 及 

Move #300, 1000 
请 解释 这 种 差异 。 


2.17 在 一 个 程序 中 寄存 器 R5 用 来 指向 一 个 栈 的 栈 项 。 使 用 变 址 、 自 动 递 增 和 自动 递减 寻 址 方式 


2.18 


2.19 


2.20 


2.21 


2.22 


写 一 个 指令 序列 ， 执 行 以 下 的 各 个 任务 : 

(a) 弹出 栈 顶 上 的 两 项 内 容 ， 将 它们 相 加 ， 然 后 将 结果 压 人 栈 中 。 

(b) 从 栈 顶 将 第 五 项 内 容 拷贝 到 寄存 器 R3 中 。 

(c) 从 栈 中 删除 前 十 项 内 容 。 

一 个 按 字 节 的 FIFO 队 列 保 存在 内 存 中 ， 它 占有 一 个 字 节 的 固定 范围 。 需 要 两 个 指针 ， 一 

个 IN 指 针 和 一 个 OUT 指 针 。IN 指 针 保存 将 要 被 添加 到 队列 中 的 下 一 个 字 节 所 在 位 置 轨迹 ， 

而 OUT 指 针 保存 将 要 从 队列 中 移出 的 下 一 个 字 节 所 在 位 置 的 轨迹 。 

(a) 当 数 据 项 加 到 队列 中 时 ， 它 们 被 加 到 连续 的 高 地 址 处 ， 直 到 达到 存储 范围 顶端 。 当 一 个 
新 的 数据 项 加 到 队列 时 ， 下 一 步 将 发 生 什么 事情 ? 

(b) 对 于 IN 和 OUT 指 针 选 择 一 个 合适 的 定义 ， 说 明 它 们 指向 数据 结构 中 的 什么 内 容 ? 使 用 
简 图 说 明 你 的 答案 。 

(c) 证 明 如 果 这 个 队列 的 状态 只 能 用 两 个 指针 描述 ， 则 队列 完全 满 和 完全 空 这 种 情况 就 是 难 
以 区 分 的 。 

(d) 为 了 解决 (c) 中 的 问题 需要 添加 什么 条 件 ? 

(e) 针对 操作 IN 和 OUT 两 指针 向 读 队 列 中 添加 和 从 读 队 列 中 移出 数据 项 过 程 ， 给 出 一 个 程序 。 


考虑 在 问题 2.18 中 描述 的 队列 结构 ， 写 出 APPEND 和 REMOVE 程 序 ， 它 们 完成 将 数据 在 处 


理 器 寄存 器 和 该 队列 中 进行 传送 的 任务 。 每 当 一 个 操作 被 检测 并 执行 时 ， 要 小 心地 检查 并 

修改 队列 和 指针 的 状态 。 

为 了 保存 一 个 子 程序 的 返回 地 址 ， 考 虑 以 下 情况 : 

(a) 在 处 理 器 的 寄存 器 中 。 

(b) 在 一 个 与 调用 有 关 的 存储 单元 中 ， 因 此 当 子 程序 从 不 同 的 地 方 被 调用 时 将 使 用 不 同 的 
单元 。 

(c) 在 一 个 堆栈 中 。 

在 这 些 可 能 性 中 哪 一 个 支持 子 程序 幅 套 ? 哪 一 个 支持 子 程序 递归 (也 就 是 子 程序 调用 自 

4)? 

计算 机 的 子 程序 调用 指令 将 返回 地 址 保存 在 称 为 链接 寄存 器 RL 的 处 理 器 寄存 器 中 ， 为 了 多 

许 子 程序 能 够 做 套 将 需要 做 些 什么 ? 将 采用 什么 策略 使 得 子 程序 可 以 调用 自身 ? 

假设 想 要 在 一 个 计算 机 中 按 如 下 方式 组 织 子 程序 调用 : 当 程 序 Main 想 要 调用 子 程序 SUB1 

时 ， 它 调用 一 个 中 间 程 序 CALLSUB， 并 且 将 SUB1 的 地 址 作为 一 个 参数 传递 给 它 ， 放 在 寄 

存 器 R1 中 。CALLSUB 将 返回 地 址 保存 到 一 个 栈 中 ， 并 确认 该 栈 的 上 限 没 有 超出 。 然 后 转 

移 到 SUB1 中 。 为 了 返回 到 调用 程序 中 ， 子 程序 SUB1 调 用 另 一 个 中 间 程 序 RETRN。 这 个 程 
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2.23 


2.24 
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序 检测 到 这 个 栈 是 非 空 的 ， 然 后 使 用 栈 顶 元 素 返 回 到 原 调用 程序 中 。 

写 出 程序 CALLSUB 和 RETRN ,假定 子 程序 调用 指令 将 返回 地 址 保存 在 一 个 链接 寄存 器 RL 
中 ， 这 个 栈 的 上 限 和 下 限 分 别 记 录 在 内 存单 元 UPPERLIMIT 和 LOWERLIMIT 中 。 

在 图 2-37 的 链表 插入 子 程序 中 ， 没 有 检测 匹配 的 新 记录 ID 号 是 否 在 该 列表 中 已 存在 一 条 记 
录 。 在 子 程序 执行 中 如 果 是 这 种 情况 ， 将 会 发 生 什么 事情 ?修改 这 个 子 程序 ， 如 果 出 现 这 
种 情况 ， 将 匹配 记录 的 地 址 返回 到 寄存 器 ERROR 中 ; 如 果 插 和 人 成功 返 回 一 个 0。 

在 图 2-38 的 链表 删除 子 程序 中 ， 已 假定 保存 在 寄存 器 RIDNUM 中 ID 号 的 记录 在 表 中 是 存 
在 的 。 如 果 在 这 个 子 程序 执行 中 没有 该 ID 号 的 记录 时 将 会 发 生 什么 情况 ”修改 这 个 子 程 
序 ， 如 果 删 除 成 功 给 RIDNUM 返 回 一 个 0;， 如 果 记 录 没 有 在 这 个 表 中 ， 则 保持 RIDNUM 的 
值 不 变 。 
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ARM、Motorola 与 Intel 指 令 集 


本 章 目标 


本 章 由 三 个 独立 的 部 分 组 成 。 你 将 了 解 到 以 下 指令 集 (指令 系统 ) 体系 结构 : 
“ARM (部 分 1) 

。Motorola 68000 (部 分 IT) 

° Intel IA-32 Pentium (部 分 I ) 


在 第 2 章 中 我 们 已 经 介绍 了 指令 集 、 寻 址 方式 以 及 指令 执行 的 基本 概念 ， 并 采用 汇编 语言 编写 
了 一 些 机 器 指令 和 程序 作为 例子 进行 了 说 明 。 本 章 将 学 习 这 些 基本 概念 是 如 何在 ARM、Motorola 
68000 和 Intel IA-32 上 实现 的 。 其 中 ，ARM 指 令 集 是 采用 RISC 设 计 方式 的 典型 例子 ， 而 68000 和 IA- 
32 则 采用 了 CISC 设 计 方 式 。 本 章 由 三 部 分 构成 ， 三 种 指令 集 各 占 一 部 分 ， 每 一 部 分 都 是 完全 独立 
的 单元 。 为 了 能 更 好 地 理解 第 2 章 中 的 基本 概念 和 程序 ， 我 们 在 本 章 中 采用 更 加 简要 的 方式 进行 讨 
论 。 在 附录 B、 附 录 C 和 附录 D 中 给 出 了 这 三 种 ISA 的 概述 ， 其 中 的 内 容 比 本 章 要 更 详细 。 


部 分 | ARM 实 例 


Advanced RISC Machines (ARM) 有 限 公 司 已 经 设计 出 了 一 系列 微 处 理 器 ， 同 时 还 允许 将 此 
设计 用 于 其 他 公司 的 计算 机 产品 和 帐 入 式 系 统 的 芯片 应 用 中 。ARM 公 司 是 一 个 比较 年 轻 的 公司 ， 
正 处 于 不 断 发 展 的 阶段 ， 它 的 前 身 是 20 世 纪 80 年 代 早 期 主要 开发 处 理 器 的 Acorn Computers 公 司 。 
ARM 微 处 理 器 主要 用 于 低 功 耗 、 低 成 本 的 伐 和 人 式 产品 ， 如 移动 电话 、 通 信 中 的 调制 解 调 器 、 自 动 
机 车 管理 系统 以 及 和 掌上 数字 助手 由。Furberr? 的 著作 对 于 ARM 设 计 和 实现 作 了 详细 阐述 ; 在 
Clements3 的 书 中 使 用 ARM 作 为 主要 实例 ， 人 在 van Someren 和 Atackm 的 书 中 采用 汇编 语言 对 ARM 进 
行 了 描述 。 我 们 还 可 以 从 ARM 的 网 站 @ 上 获取 更 多 详细 信息 。 所 有 的 ARM 处 理 器 都 具有 相同 的 基 
本 机 器 指令 集 。 本 章 使 用 的 是 在 ARM7 处 理 器 中 实现 的 版 本 。 后 续 版 本 增加 了 一 些 与 本 章 讨论 的 
内 容 不 相关 的 其 他 特征 , 在 第 11 章 中 将 介绍 这 些 增加 的 特征 , 为 了 说 明 ARM 体 系 结构 的 不 同 特点 ， 
我 们 采用 第 2 章 中 的 程序 进行 讨论 ， 并 且 用 ARM 汇 编 语言 来 说 明 ARM 体 系 结构 的 各 个 方面 。 


3.1 寄存 器 、 内 存 访问 及 数据 传递 


在 ARM 体 系 结构 中 ， 内 存 是 按照 字 节 进行 编 址 的 ， 每 个 字 节 的 地 址 是 32 位 ， 处 理 器 中 寄存 
器 的 长 度 也 是 32 位 。 在 内 存 和 处 理 器 寄存 器 之 间 传 送 数据 时 采用 的 是 两 种 操作 数 长 度 : 字 节 
(8 位 ) 和 字 (32 位 )。 字 地 址 必须 是 对 齐 的 ， 也 就 是 必须 是 4 的 倍数 ， 且 同时 支持 little-endian 和 
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big-endian 两 种 内 存 寻 址 方式 《参见 2.2.2 节 )。 两 种 寻 址 方式 的 选择 是 通过 一 条 与 处 理 器 相连 的 外 
部 输入 控制 线 来 完成 。 当 内 存 向 处 理 器 寄存 器 载 人 字 节 或 寄存 器 向 内 存 存储 字 节 时 ， 通 常 使 用 
寄存 器 的 低位 部 分 。 

内 存 访 问 只 使 用 Load 和 和 Store 指令. 所 有 的 算术 和 逻辑 指令 操作 的 数据 都 放 在 处 理 器 寄存 器 中 。 
这 是 RISC 体 系 结构 的 基本 特征 。 这 种 处 理 器 设计 的 简化 意义 及 其 性 能 我 们 将 在 第 8 章 中 介绍 。 


3.1.1 寄存 器 结构 


应 用 程序 使 用 的 处 理 器 寄存 器 如 图 3-1 所 示 。 图 中 一 共有 16 个 32 位 寄存 器 ， 分 别 标注 为 RO 到 
R15， 这 些 寄存 器 中 包含 了 15 个 通用 寄存 器 (RO 到 R14) 和 一 个 程序 计数 器 (PC) 寄存 器 R15。 
通用 寄存 器 可 以 保存 任何 一 个 内 存 地 址 或 操作 数 。 当 前 程序 状态 寄存 器 (CPSR) 或 简单 的 状态 
寄存 器 中 ,保存 的 内 容 是 条 件 码 标志 (N, Z, C, V)、 中 断 禁 止 标志 和 处 理 器 模式 位 。 条 件 码 标志 
代表 的 信息 我 们 在 2.4.6 节 中 描述 过 。 处 理 器 模式 位 和 中 断 楚 止 标志 的 使 用 ， 我 们 将 在 第 4 章 中 的 
输入 /输出 操作 和 中 断 的 相关 部 分 中 进行 描述 。 此 处 ， 我 们 假定 处 理 器 的 工作 模式 是 用 户 模式 ， 
并 且 正 在 执行 一 个 应 用 程序 。 

此 外 ， 还 有 15 个 附加 的 通用 寄存 器 ， 称 为 后 备 寄 丰 器。 它们 保存 的 内 容 是 RO 到 R14 寄 存 器 中 
的 某 些 副本 。 当 处 理 器 切换 到 管 态 或 中 断 操作 方式 的 时 候 就 要 使 用 后 备 寄存 器 了 。 这 些 后 备 寄 
存 器 和 状态 寄存 器 副本 内 容 也 将 在 第 4 章 中 介绍 。 
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图 3-1 ARM 寄 存 器 结构 
3.1.2 内 存 访问 指令 和 寻 址 方式 


ARM 体 系 结构 中 的 每 条 指令 都 是 采用 典型 的 RISC 设 计 方式 ， 按 照相 应 的 统一 的 方式 编码 成 
一 个 32 位 的 字 。 内 存 访问 只 提供 了 两 条 指令 : Load 和 Store 指 令 。 这 些 指令 的 基本 编码 格式 与 传 
送 指令 、 算 术 指 令 及 逻辑 指令 一 样 ， 都 采用 图 3-2 所 示 的 格式 。 附 录 B 中 给 出 了 更 详细 的 说 明 。 
在 一 条 指令 中 指定 了 一 个 条 件 执行 码 (条 件 )、OP 码 、 两 个 或 三 个 寄存 器 (Ra, Rd4 和 Rm)， 以 及 
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一 些 其 他 信息 。 如 果 不 需 要 使 用 寄存 器 Rm， 则 “其 他 信息 ”字段 就 扩展 到 bo 位 。 在 Load 指 令 中 ， 
操作 数 从 内 存 传送 到 通用 寄存 器 中 ， 该 寄存 器 使 用 4 位 的 Rd 字段 来 命名 。 在 Store 指 令 中 ， 操 作 数 
从 Rd 传送 到 内 存 中 。 如 果 操 作 数 是 字 节 ， 通 常 将 其 放 在 寄存 器 的 低位 字 节 部 分 ， 在 Load 指 令 中 ， 
寄存 器 中 高 位 的 24 位 全 部 用 0 填充 。 
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图 3-2 ARM 指 令 格 式 


指令 的 条 件 执行 

ARM 处 理 器 的 特色 也 是 很 特别 的， 即 全 部 的 指令 都 是 依赖 于 在 指令 中 指定 的 条 件 而 完成 的 
条 件 执行 。 只 有 处 理 器 条 件 码 标志 的 当前 状态 满足 了 指令 中 的 位 六 2s 所 指定 的 条 件 时 ， 该 指令 
才 可 以 执行 。 否 则 ， 处 理 器 将 处 理 下 一 条 指令 。 其 中 有 一 个 条 件 是 用 来 表示 该 指令 总 是 被 执行 
的 。 条 件 执行 的 优点 我 们 将 在 3.7 节 中 通过 例子 来 说 明 。 下 面 ， 暂 时 忽略 这 个 特点 并 假定 指令 中 
的 条 件 字段 中 的 代码 是 “总 被 执行 ”的 。 

内 存 寻 址 方式 

对 内 存 操作 数 寻 址 的 基本 方法 就 是 产生 操作 数 的 有 效 地 址 (EA )， 也 就 是 通过 将 基 址 寄存 器 
Rn 的 内 容 加 上 一 个 带 符号 的 偏 移 量 产生 的 结果 ， 其 中 的 Rn 是 在 图 3-2 中 所 示 指 令 中 指定 的 。 偏 移 
量 的 值 可 以 是 包含 在 指令 中 最 低 12 位 中 的 一 个 立即 数 ， 或 者 是 第 三 个 寄存 器 (Rm， 用 指令 中 的 
最 低 四 位 .(b3-o) 所 命名 ) 的 内 容 。 偏 移 量 的 符号 (方向 ) 包含 在 操作 码 字 段 中 。 

例如 ，Load 指 令 

LDR Rd, [Rn,# offset ] 
指明 在 立即 数 方式 中 的 偏 移 量 (表示 为 一 个 有 符号 数 )， 执 行 的 操作 是 
Rd [[Rxn]+offset] 
注意 : 目标 寄存 器 Rd 要 放 在 前 面 。 这 种 用 法 与 第 2 章 中 的 用 法 正好 相反 。 指 令 
LDR Rd,[Rn,Rm] 
执行 的 操作 是 
f Rd-[[Rn]+[Rm]] 
由 于 Rm 中 的 内 容 是 偏 移 量 的 值 ， 如 果 需 要 的 是 负数 偏 移 量 ， 必 须 在 Rm 前 面 带 一 个 负 号 。 在 第 2 
章 中 ， 这 两 种 寻 址 方式 分 别 对 应 于 变 址 方式 中 的 变 址 和 基 址 。 如 果 偏 移 量 是 0 就 无 需 明确 指定 。 
因此 ， 指 令 
LDR Rd, [Ra] 
执行 的 操作 是 
Rd-[[Rn]] 

所 使 用 的 寻 址 方式 就 是 第 2 章 中 的 间接 寻 址 方式 。 

操作 码 助 记 符 LDR 表示 将 一 个 32 位 的 字 从 内 存 装 入 到 寄存 器 中 。 如 果 是 字 节 操作 数 ， 就 使 
用 LDRB 将 该 操作 数 放 到 寄存 器 的 低 字 节 位 置 。 高 字 节 部 分 全 部 用 0 填充 。 

Store 指 令 的 助 记 符 有 STR 和 STRB。 例 如 ， 指 令 
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STR Rd,[Rn] 
执行 的 操作 是 
[Rn]— [Ra] 


将 一 个 字 操 作 数 传送 到 内 存 中 。STRB 指 令 传送 的 是 Ra 中 低位 部 分 中 的 字 节 。 

ARM 文 档 中 提 到 的 所 有 这 些 模式 以 及 其 他 将 要 简要 描述 的 模式 都 采用 基于 变 址 的 寻 址 方式 。 
在 前 面 的 例子 中 所 使 用 的 形式 称 为 预 变 址 寻 址 方式 ， 因 为 操作 数 的 有 效 地 址 是 通过 将 基 址 寄存 器 
Rn 的 内 容 加 上 偏 移 量 来 产生 的 。 其 中 基 址 寄存 器 Rn 的 内 容 是 不 变 的 。 这 种 寻 址 方式 与 我 们 第 2 章 中 
讨论 过 的 自动 递减 和 自动 递增 方法 相 类 似 。 它 们 分 别称 为 “ 带 写 回 的 预 变 址 ”和 “传递 变 址 ”。 

这 三 种 方法 的 定义 如 下 











预 变 址 方式 一 操作 数 的 有 效 地 址 是 基 址 寄存 器 的 内 容 与 偏 移 量 的 和 。 

带 瑟 名 的 预 变 址 方式 一 一 操作 数 的 有 效 地 址 的 产生 方法 与 预 变 址 方式 相同 ， 之 后 ， 有 效 地 
址 要 写 回 到 Rn 中 。 

传递 变 址 方式 一 一 操作 数 的 有 效 地 址 是 Rn 的 内 容 。 偏 移 量 然后 加 到 这 个 地 址 上 ， 并 且 这 个 
结果 写 回 到 Rz 中 。 


表 3-1 说 明了 这 些 寻 址 方式 的 汇编 语言 语法 ， 并 给 出 了 计算 有 效 地 址 (EA) 和 写 回 操作 的 表 


达 式 。 在 预 变 址 寻 址 方式 中 的 惊叹 号 是 用 来 表示 写 回 操作 的 。 由 于 传递 变 址 方式 中 经 常 包括 写 


回 操作 ， 因 此 将 惊叹 号 省 略 了 。 注 意 ， 要 区 别 预 寻 址 和 传递 寻 址 中 方 括号 的 不 同 使 用 方法 。 当 
方 插 号 中 只 有 基 址 寄存 器 时 ， 该 寄存 器 的 内 容 当 作 有 效 地 址 使 用 。 在 访问 完 操作 数 之 后 ， 将 偏 
移 量 与 寄存 器 的 内 容 相 加 。 换 句 话 说， 指定 的 是 传递 变 址 方式 。 它 是 在 2.5 节 中 描述 过 的 自动 递 
增 寻 址 方式 的 一 种 概括 形式 。 当 基 址 寄存 器 和 偏 移 量 同时 放 到 方 括号 中 时 ， 那 么 操作 数 的 有 效 
地 址 就 是 两 者 之 和 ， 也 就 是 使 用 预 变 址 方式 。 如 果 要 执行 回 写 操作 ， 必 须 用 惊叹 号 (!) 来 标明 。 
带 有 写 回 的 预 变 址 是 在 2.5 节 中 讨论 过 的 自动 递减 寻 址 方式 的 一 种 概括 形式 。 


表 3-1 ARM 变 址 寻 址 方式 
和 


名 称 汇编 语法 寻 址 功能 
带 有 立即 偏 移 量 
预 变 址 [Rn, #offset] EA = [Rnl + offset 
带 写 加 的 预 变 址 [Rn, #offset]! EA = [Rn] + offset 
Rn < [Rn] + offset 
传递 变 址 [Rn], #offset EA = [Rn] 
Rn - [Rn] + offset 
Rm PRA IRTE bt 18 
Eh {Rn, + Rm, shift] EA = [Ra] + [Rml shifted 
带 写 四 的 预 变 址 [Rn, + Rm, shift]! EA = [Rn] + [Rm] shifted 
Ra = [Rn] + [Rm] shifted 
传递 变 址 [Rn], + Rm. shift EA = [Rnl 
Rn ~ [Rn] + [Rm] shifted 
相对 的 寻 址 方式 位 器 EA = Location 
带 有 立即 偏 移 量 的 预 变 址 = [PC] + offset 
EA = # 3k Mh, bk 


Offset = 包含 在 指令 中 的 有 符号 数 

Shift = 方向 # 整 数 

这 里 方向 是 LSL 时 为 堪 攀 ， 是 LSR 时 为 右 移 ; 整数 是 一 个 5 位 的 无 符号 起 数 ， 用 来 说 明 移 位 的 量 
+Rm= 寄存 器 Rm 中 的 偏 移 重 值 ， 可 以 从 基 址 寄存 器 Rn 中 加 上 或 减 去 





ARM. Motorola 5 Intel2# 4 £ 77 


在 所 有 这 三 种 寻 址 方式 中 ， 可 以 将 偏 移 量 指定 为 范围 在 + 上 4095 之 间 的 一 个 立即 数 。 回 时 ， 
偏 移 量 的 值 还 可 以 通过 第 三 个 寄存 器 (Rm) 的 内 容 来 指定 ， 在 该 寄存 器 名 称 前 面 带 有 + 前缀 的 
偏 移 量 符号 (方向 )。 例 如 ， 指 令 

LDR RO,[R1,— R2]! 
执行 的 操作 是 
RO—[[R1]-[R2]] 
由 于 用 惊叹 号 说 明了 写 回 ， 所 以 操作 数 [1] - [R2] 的 有 效 地 址 然后 被 装 入 到 R1l 中 。 

如 果 偏 移 量 采用 寄存 器 指定 ， 那 么 它 可 以 通过 向 左 向 右 移 位 缩放 2 的 乘 宕 。 这 在 汇编 语言 中 
是 在 寄存 器 Rm 之 后 放置 指定 移动 方向 (LSL 是 向 左 移动 ，LSR 是 向 右 移动 ) 和 移动 的 位 数 来 实 
现 的 ， 如 表 3-1 所 示 。 移 动 的 位 数 是 通过 范围 在 0 到 31 之 间 的 一 个 立即 数 指定 。 例 如 ， 上 例 中 的 
R2 的 内 容 在 作为 偏 移 量 使 用 之 前 可 能 要 乘 以 16， 那 么 将 它 表述 如 下 : 

LDR RO,[R1,—R2, LSL #4] ! 
该 指 令 将 执行 如 下 操作 
RO-—[[R1]- 16 x [R2] ] 
之 后 ， 将 有 效 地 址 装 到 RI 中 。 

程序 计数 器 (PC) 可 以 当 作 基 址 寄存 器 Rn 使 用 。 这 种 情况 下 所 使 用 的 是 在 2.5 节 中 描述 过 的 
相对 寻 址 方式 。 汇 编程 序 要 判定 在 操作 数 地 址 和 更 新 过 的 PC 内 容 之 间 的 一 个 有 符号 的 距离 ， 将 
它 作 为 一 个 立即 偏 移 量 。 当 有 效 地 址 是 在 指令 执行 期 间 被 计算 出 来 的 ， 那 么 PC 内 容 已 经 更 新 到 
从 包含 有 该 相对 寻 址 方式 指令 向 前 的 两 个 字 (8 个 字 节 ) 的 地 址 上 。 这 样 做 的 原因 是 与 指令 的 流 
水 线 执行 有 关 ， 我 们 将 在 第 8 章 中 介绍 。 

图 3-3a 中 给 出 了 相对 寻 址 方式 的 一 个 例子 。 指 令 中 给 出 的 象征 符号 ITEM 表 示 操 作 数 的 有 效 
地 址 ， 它 的 值 是 1060。 在 ARM 体 系 结构 中 不 能 使 用 绝对 寻 址 方式 。 因 此 ， 当 用 汇编 语言 按照 这 
种 方式 给 出 操作 数 的 有 效 地 址 时 ， 汇 编程 序 通常 使 用 相对 寻 址 方式 。 它 采用 的 是 带 有 立即 数 的 
偏 移 量 ， 采 用 将 PC 作为 基 址 寄存 器 的 预 变 址 方式 来 实现 的 。 正 如 图 中 所 示 ， 汇 编程 序 计 算出 来 
的 偏 移 量 是 52， 由 于 PC 在 程序 执行 期 间 将 偏 移 量 加 到 PC 上 的 时 候 它 的 值 是 1008， 因 此 生成 的 有 
效 地 址 是 1060 = 1008 + 52。 操 作 数 必须 处 于 被 更 新 的 PC 值 之 前 或 之 后 的 4095 的 范围 内 。 如 果 指 
令 中 给 出 的 操作 数 的 地 址 超出 了 这 个 范围 ， 那 么 汇编 程序 将 显示 错误 ， 并 采用 其 他 的 寻 址 方式 
来 访问 该 操作 数 。 

图 3-3b 给 出 的 是 预 变 址 方式 的 例子 ， 该 方式 中 的 偏 移 量 放 在 寄存 器 R6 中 ， 基 址 的 值 放 在 R5 
中 。Store 指 令 (STR) 将 R3 中 的 内 容 保存 到 内 存 1200 单 元 的 字 中 。 

图 3-4 中 所 示 的 例子 说 明 的 是 在 传递 变 址 和 预 变 址 寻 址 方式 中 的 写 回 特 征 的 有 效 性 。 图 3-4a 
显示 的 是 具有 25 个 数 ， 每 个 数 分 别 占 用 25 个 字 的 列表 中 的 前 三 个 数 ， 表 的 起 始 内 存 地 址 是 1000。 
这 样 ， 它 们 构成 了 一 个 25 x 25 按 列 存储 的 数值 惩 阵 的 第 一 行 。 和 矩阵 中 的 第 一 行 的 第 -个 数 保 存 
在 位 置 为 1000 的 字 中 。 第 一 行 的 后 续 数 分 别 保存 在 地 址 1100, 1200, …, 3400 处 。25 个 内 存 位 置 
1000, 1004, 1008, …, 1096 包 含 矩阵 的 第 一 列 。 


x 
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内 存 地 址 | 字 (4 字 w) I 

Te er — 

1000 LDR RI, ITEM | 
— 


em meses es 














1004 ， 
1008 | | 更 新 的 [PC] = 1008 
一 一 
| | 守信 和 
i — 1 
ITEM = 1060 | 操作 数 
$ š 
a) 相对 寻 址 方式 
| | 
STR R3,[R5,R6] | , 1000 | R5 
- : 基 址 寄存 器 
| 200 | R6 
iT RESIES 
| 200= 偏 移 量 
b) ie ht RE y Ñ 


图 3-3 ARM 内 存 寻 址 方式 实例 


采用 偏 移 量 的 带 有 写 回 的 传递 变 址 寻 址 方式 ， 可 以 非常 方便 地 对 年 阵 中 的 第 一 行 连续 的 数 
值 进行 访问 。 假 定 R2 用 作 基 址 寄存 器 ， 它 的 初始 地 址 值 是 1000。 寄 存 器 R10 用 来 保存 偏 移 量 ， 它 
被 装 入 的 值 是 25。 则 指令 

LDR RI1,[ R21,R10,LSL#2 


可 以 用 在 一 个 通过 连续 的 循环 操作 将 矩阵 第 一 行 中 的 连续 元 素 装 人 到 寄存 器 R1 中 的 程序 中 。 
下 面 让 我 们 一 步 一 步 分 析 它 是 如 何 工作 的 。 在 第 一 次 执行 Coad 指 人 时 | 有 效 地 址 是 [R2] = 
1000。 因 此 ， 该 地 址 中 的 数值 6 被 装 到 R1 中 。 之 后 ， 写 回 操作 将 R2 的 内 容 从 1000 改 写成 1100， 
这 样 指向 第 二 个 数值 - 17。 这 是 通过 对 偏 移 量 寄存 器 中 的 内 容 25 进 行 左 移 两 位 之 后 加 上 R2 的 
内 容 而 得 到 的 。 在 这 个 处 理 过 程 中 R10 的 内 容 是 不 变 的 。 左 移 两 位 等 价 于 25 乘 以 4， 它 生成 了 
所 需 的 偏 移 量 100。 这 个 偏 移 量 和 R2 的 内 容 相 加 之 后 ， 新 的 地 址 1100 被 写 回 到 R2 中 。 在 第 二 遍 
循环 中 执行 Load 指 令 时 ， 第 二 个 数 - 17 被 装 到 R1i 中 。 在 第 三 遍 中 第 三 个 数 321 被 装 到 R1 中 ， 
依次 类 推 。 
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执行 完 压 栈 š 
指 £ 之 后 STR RO,R5,#-4]' 
b) 带 写 回 的 预 变 址 寻 址 
图 3-4 带 有 写 回 的 ARM 内 存 寻 址 方式 


本 例 中 包括 将 偏 移 量 寄存 器 中 的 内 容 进 行 移 位 并 与 基 址 寄存 器 中 的 内 容 相 加 。 像 表 3-1 中 说 
明 的 那样 ， 移 位 后 的 偏 移 量 还 可 以 与 基 址 寄存 器 的 内 容 相 减 。 可 以 选择 的 移动 距离 的 范围 是 0 到 
31， 而 且 左 右 移动 都 可 以 。 

图 3-4b 所 示 的 是 将 寄存 器 R0 中 的 内 容 27 放 到 堆栈 上 的 一 个 例子 。 寄 存 器 R5 被 当 作 堆 栈 指 针 
使 用 。 最 初 ， 它 包含 当前 TOS ( 栈 顶 ) 元 素 的 地 址 2012。 采 用 带 有 写 回 的 预 变 址 寻 址 方式 ， 使 
用 一 个 立即 数 偏 移 量 来 完成 压 栈 操 作 ， 其 指令 是 : 

STR R0,[R5,#-4]! 
立即 数 偏 移 量 - 4 加 到 R5 的 内 容 2012 上 ， 之 后 将 其 写 回 到 Rs 中 。 这 个 新 TOS 位 置 2008 用 作 Store 操 
作 的 有 效 地 址 。 寄 存 器 R0 的 内 容 27 被 存储 到 2008 单 元 中 。 

多 个 操作 数 的 Load/Store 指 令 

除了 单 操作 数 的 Load 和 Store 指 令 以 外 ， 还 有 多 操作 数 的 Load 和 Store 指 令 。 它 们 称 为 “ 块 传 
递 指令 “。 任 何 通用 寄存 器 都 可 以 用 来 装 和 信和 存储 。 但 是 只 允许 字 操 作 数 ， 其 操作 码 为 LDM ( 装 
入 多 个 ) 和 STM (存储 多 个 )。 内 存 操作 数 的 存储 位 置 必须 是 连续 的 字 单 元 。 无 论 是 预 变 址 还 是 
传递 变 址 方式 ， 带 写 回 和 不 带 写 回 的 寻 址 方式 都 可 以 采用 。 它 们 使 用 的 基 址 寄存 器 Rn 是 在 指令 
中 指定 的 。 在 这 些 指令 中 偏 移 量 的 值 通常 都 是 4， 所 以 无 需 在 指令 中 明确 指明 。 在 汇编 语言 表达 
式 中 ， 指 令 中 使 用 的 寄存 器 列表 必须 是 按照 升序 出 现 。 例 如 ， 假 定 寄存 器 R10 用 作 基 址 寄存 器 ， 
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它 的 初始 值 是 1000。 那 么 ， 指 令 
LDMIA R10!, (R0,R1, R6, R7} 
将 位 置 1000, 1004, 1008 和 1012 处 的 字 传 送 到 寄存 器 R0. R1, R6, R7 中 ， 在 最 后 的 传送 完成 之 前 ， 
地 址 1016 一 直 保 存在 R10 中 。 操 作 码 中 的 后 组 IA 表 示 “ 后 增 "， 对 应 于 传递 变 址 。 我 们 将 在 后 面 
的 3.6 节 中 结合 子 程序 的 实现 (有 关 在 堆栈 上 保存 和 恢复 寄存 器 的 有 效 方式 ) 来 讨论 Load/Store 多 
操作 数 指令 。 
3.1.3 寄存 器 传送 指令 
经 常 需要 将 一 个 寄存 器 中 的 内 容 复 制 到 另 一 个 寄存 器 中 ， 或 者 是 将 一 个 立即 数 存 放 到 一 个 
寄存 器 中 。 传 送 指 令 
f MOV Rd,Rm 
使 用 图 3-2 中 的 指令 格式 ， 将 寄存 器 Rm 中 的 内 容 复制 到 寄存 器 Rd 中 。 指 令 中 低 8 位 的 立即 数 操作 
数 通 常 也 是 利用 Move 指 令 来 装 入 到 寄存 器 Rd 中 的 。 例 如 ， 
MOV RO, #76 
将 立即 数 76 放 到 寄存 器 RO 中 。 在 这 两 种 传送 指令 形式 中 ， 原 操作 数 在 放 到 目标 寄存 器 之 前 都 是 
可 以 进行 移 位 操作 的 。 
3.2 算术 和 逻辑 指令 


ARM 指 令 集中 有 很 多 用 于 算术 和 有 远 辑 操作 的 指令 ， 其 操作 数 可 以 是 在 通用 寄存 器 中 ， 也 可 
以 是 指令 本 身 中 给 出 的 立即 操作 数 。 这 些 指令 不 允许 使 用 内 存 操 作 数 。 加 法 和 减法 有 不 同形 式 
的 指令 ， 此 外 还 有 两 条 乘法 指令 ， 以 及 一 些 逻辑 指令 (如 与 、 或 、 非 、 异 或 和 位 清除 )。 指 令 集 
中 还 提供 了 基于 两 个 操作 数 的 算术 或 逻辑 操作 的 结果 来 设置 条 件 码 标志 的 比较 指令 。 比 较 指令 
并 不 将 实际 的 结果 保存 到 寄存 器 中 。 大 部 分 这 些 指令 的 格式 都 如 图 3-2 所 示 的 那样 。 
3.2.1 算术 指令 
算术 指令 的 汇编 语言 表达 式 是 
操作 码 Rd, Rn, Rm 
由 操作 码 指定 的 操作 是 利用 通用 寄存 器 Rn 和 Rm 来 完成 的 ， 结 果 保 存 到 寄存 器 Ra 中。 例如， 指令 
ADD R0, R2, R4 


执行 的 操作 
RO—[R2]+[R4] 
而 指令 
SUB R0,R6, R5 
执行 操作 


RO - [R6] - [R5] 
如 果 不 使 用 寄存 器 Rm， 第 二 个 操作 数 可 以 用 立即 数 的 方式 给 出 。 这 样 
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ADD RO, R3,#17 
执行 的 操作 
RO~[R3]+17 
立即 数 包含 在 指令 中 的 低 8 位 by-o 中 。 
第 二 个 操作 数 在 用 于 操作 之 前 可 以 进行 移 位 或 循环 移 位 操作 。 当 需要 进行 移 位 或 循环 移 位 
操作 时 ， 在 指令 的 汇编 语言 表达 式 的 最 后 进行 说 明 。 指 令 
ADD RO, R1, R5, LSL #4 
操作 如 下 : 在 寄存 器 R5 中 的 第 二 个 操作 数 要 左 移 4 位 《等 价 于 [R51x 16) ， 然 后 与 寄存 器 Ri 中 的 
内 容 相 加 ， 和 保存 在 寄存 器 RO 中 。 
乘法 指令 提供 两 种 版 本 ， 第 一 种 版 本 将 两 个 寄存 器 中 的 内 容 相 乘 ， 然 后 将 乘积 的 低 32 位 保 
存 到 第 三 个 寄存 器 中 ， 乘 积 的 高 位 (如 果 有 的 话 ) 将 被 丢弃 。 例 如 ， 指 令 
MUL RO0,R1,R2 
执行 的 操作 
RO - [R1] x [R2] 
第 二 个 版 本 指定 了 第 四 个 寄存 器 ， 在 将 结果 保存 到 目标 寄存 器 中 之 前 ， 它 的 内 容 与 乘积 相 加 。 
因此 ， 指 令 
MLA R0,R1,R2, R3 
执行 操作 
RO- [R1] x [R2] + [R3] 
这 称 为 “乘法 累加 ”操作 。 这 种 操作 经 常用 于 数字 信号 处 理 中 的 数字 算法 。 我 们 将 在 3.7 节 中 看 
到 这 类 应 用 的 一 个 例子 。 在 图 3-2 中 的 第 四 个 寄存 器 是 在 其 他 信息 字段 中 进行 编码 的 。 在 这 两 个 
操作 数 用 于 两 条 乘法 指令 之 前 ， 并 没 提供 任何 用 于 移 位 或 循环 移 位 的 操作 数 。ARM ISA 的 一 些 
版 本 中 还 允许 双 倍 长 度 的 乘积 《64 位 )( 请 参见 第 11 章 )。 
操作 数 移 位 操作 
我 们 注意 到 前 面 ARM 指 令 系统 的 一 个 最 显著 的 特征 是 它 的 全 部 指令 都 是 有 条 件 执行 的 。 访 
系统 的 另 一 个 特征 是 大 多 数 的 指令 中 都 包含 了 移 位 操作 和 循环 移 位 操作 。 而 在 其 他 的 计算 机 指 
令 系统 中 ， 移 位 操作 都 是 采用 单独 的 指令 来 完成 的 。 在 本 章 中 的 部 分 HI 和 部 分 II 中 描述 的 
Motorola 68000 和 Intel IA-32 处 理 器 就 是 采用 这 种 方式 的 。 将 移 位 和 循环 移 位 操作 按照 需要 集成 到 
指令 中 ， 使 得 ARM 体 系 结构 可 以 节省 一 定 的 代码 空间 ， 并 且 可 以 潜在 提高 在 执行 时 间 方面 的 性 
能 ， 从 而 更 加 方便 了 处 理 器 的 设计 。 这 个 特征 是 通过 在 处 理 器 中 的 寄存 器 和 算术 逻辑 单元 之 间 


的 数据 通路 中 称 为 桶 形 移 位 器 电路 来 实现 的 。 移 位 和 循环 移 位 的 更 多 可 用 的 细节 以 及 它们 指令 
格式 编码 部 分 ， 请 参见 附录 B。 


3.2.2 逻辑 指令 


逻辑 指令 与 、 或 、 异 或 和 位 清除 所 对 应 的 操作 码 分 别 训 AND、ORR、EOR 和 BIC。 这 些 指令 
与 算术 指令 具有 相同 的 指令 格式 。 指 令 


AND Rd,Rn,Rm 





2 


执行 操作 
Rd [Rn] ^ [Rm] 
它 寄 存 器 Ra 和 Rm 中 的 操作 数 按 位 进行 逻辑 与 操作 。 例 如 ， 如 果 寄 存 器 R0 包 含 的 十 六 进 制 数 是 
02FA62CA，R1 的 内 容 是 0000FFFE， 那 么 指令 
AND RO0,R0,R1 
的 结果 是 000062CA ， 并 且 结 果 被 放 到 寄存 器 RO 中 。 
位 清除 指令 (BIC) 与 AND 指 令 非 常 相近 。 该 指令 首先 将 寄存 器 Rm 中 的 内 容 按 位 求 反之 后 ， 
再 将 Rr 和 Rm 中 的 内 容 按 位 进行 与 操作 。 还 是 采用 上 例 中 相同 的 RO 和 R1 的 位 模式 ， 指 令 
BIC RO,RO,R1 
结果 的 位 模式 为 02FA0000， 并 被 放 到 R0 中 。 
传送 负数 指令 〈 操 作 码 的 助 记 符 MVN ) 将 源 操 作 数 的 各 位 求 反之 后 将 结果 放 到 Rd 中 。 如 果 
R3 的 内 容 十 六 进 制 模式 是 OFOFOFOF ， 那 么 指令 
MVN R0,R3 
将 结果 FOFOFOF0 放 到 RO 中 。 
数字 打包 程序 
图 3-5 给 出 了 一 个 将 两 个 4 位 十 进 制 数 打包 存放 在 一 个 字 节 单元 中 的 ARM 程 序 。 这 个 程序 的 
普通 版 本 如 图 2-31 中 所 示 ， 并 且 在 2.10.2 节 中 已 经 描述 过 了 。 用 ASCTI 表 示 的 十 进 制 数 存 储 在 字 节 
单元 LOC 和 LOC+1 中 。 该 程序 将 相应 的 4 位 BCD 码 打包 成 -一 个 单字 节 并 存放 在 PACKED 处 。 


将 地 址 LOC 装 入 RO 
和 将 ASCH 字 符 装 人 R1L 和 R2 


将 R2 的 高 28 位 清除 
R1 左 移 之 后 与 R2 进 行 或 运算 并 将 结果 放 入 R2 中 
将 打包 的 BCD 数 存 到 PACKED 中 





图 3-5 将 两 个 4 位 的 十 进 制 数 打包 到 一 个 字 节 单元 的 ARM 程 序 


图 3-5 程 序 中 的 第 一 个 Load 指 令 假定 地 址 LOC 已 经 存储 到 内 存 地 址 指针 POINTER 中 。 就 像 我 
们 在 3.4 节 中 看 到 的 一 样 ， 可 以 使 用 汇编 程序 指示 符 将 LOC 放 到 POINTER 中 。 必 须 使 用 这 种 方法 
来 将 地 址 LOC 装 入 R0 中 ， 因 为 在 指令 中 不 能 使 用 32 位 的 地 址 作为 立即 数 。POINTER 指 向 BCD 码 
连续 存放 的 字 节 处 。 在 接 下 来 的 两 个 Load 指 令 中 ， 分 别 将 两 个 ASCIH 码 中 保存 的 BCD 数 字 (字符 
中 最 低 4 位 ) 装 入 到 寄存 器 R1 和 R2 的 低位 部 分 。AND 指 令 将 R2 的 高 28 位 清 成 0， 保 留 最 低 四 位 中 
的 第 二 个 BCD 数 字 。 之 后 的 或 指令 将 RI 中 的 第 一 个 BCD 数 左 移 四 位 ， 并 将 其 放 到 R2 中 第 二 个 
BCD 数 的 左边 。 最 后 ，R2 中 低 字 节 打包 后 的 数字 就 可 以 保存 到 PACKED 中 了 。 


3.3 转移 指令 


条 件 转移 指令 中 包含 着 一 个 有 符号 的 24 位 的 偏 移 量 ， 它 是 用 来 与 程序 计数 器 的 更 新 内 容 相 
加 以 生成 转移 自 标 地 址 的 。 转 移 指 令 的 格式 如 图 3-6a 所 示 ， 在 图 3-6b 中 给 出 了 一 个 例子 。 指 令 
BEQ (如 果 等 于 0 就 转移 ) 在 Z 标 志 设 置 成 1 时 便 会 产生 转移 。 

需要 检测 在 指令 字 的 最 高 四 位 bs -2 中 的 条 件 ， 以 便 判断 是 否 需要 产生 转移 。 转 移 指令 与 其 
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他 的 ARM 指 令 一 样 按照 相同 的 方式 执行 ， 也 就 是 ， 只 有 条 件 码 标志 的 状态 与 相应 的 指令 中 条 件 
字段 的 条 件 相 一 致 时 ， 转 移 才 会 执行 。 

在 计算 转移 目标 地 址 的 同时 ，PC 的 内 容 已 经 更 新 成 转移 指令 所 在 地 址 的 下 两 个 字 的 指令 地 
址 。 如 果 转 移 指令 的 地 址 是 1000， 转 移 目标 地 址 是 1100， 如 图 3-6b 所 示 ， 那 么 由 于 在 计算 地 址 
1100 时 ， 更 新 的 PC 内 容 将 是 1000 + 8 = 1008， 所 以 偏 移 量 应 该 是 92。 








31 28 27 24 23 0 
22 2 
| 条 件 人 | REA | 
ed 
a) 指令 格式 


更 新 的 [PCj= 1008 | 


偏 移 最 = 92 


位 置 = 1100 | 转移 目标 指令 





b) 转移 目标 地 址 的 确定 
图 3-6 ARM 转移 指令 


3.3.1 设置 条 件 码 


有 些 指令 如 比较 指令 ， 如 下 所 示 : 
CMP Rn, Rm 
执行 这 样 的 操作 : 
[Rn] — [Rm] 
它 的 惟一 目的 就 是 根据 减法 操作 的 结果 来 设置 条 件 码 标志 。 另 一 方面 ， 算 术 和 逻辑 指令 只 有 在 
操作 码 字段 中 的 位 设置 明确 说 明 时 ， 才 能 影响 条 件 码 标志 。 这 种 方式 通过 在 汇编 语言 操作 码 助 
记 符 后 加 上 后 级 S 来 表示 。 例 如 指令 


ADDS RO, R1, R2 
是 要 设置 条 件 码 标志 的 ， 而 

ADD R0.RLR2 
就 不 设置 条 件 码 标志 。 
3.3.2 用 于 数值 相 加 的 循环 程序 


图 3-7 给 出 了 列表 中 数值 相 加 的 循环 程序 ， 它 模仿 图 2-16 中 的 程序 编写 。 前 两 步 首 先 执行 装 





A ëO 


入 和 存储 操作 ， 最 后 的 指令 使 用 的 是 相对 寻 址 方式 。 假 定 内 存 中 N、POINTER 和 SUM 都 在 与 PC 
相关 的 偏 移 量 的 有 效 范围 内 。 内 存单 元 POINTER 中 的 地 址 是 第 一 个 相 加 数 NUM1 的 地 址 ，N 中 存 
放 的 是 列表 中 数据 的 个 数 ，SUM 用 来 保存 相 加 的 和 。 循 环 中 第 一 条 指令 的 带 有 写 回 的 传递 变 址 
寻 址 方式 是 图 2-16 中 自动 递增 寻 址 方式 的 真实 反映 。 


将 计数 值 装 人 RI 

将 地 址 NUM1 装 入 R2 
清空 累加 器 RO 

将 下 一 个 数 装 人 R3 


相 加 数值 到 RO 

对 循环 计数 器 R1 减 1 

如 果 没有 完成 ， 转 移 返 加 
保存 累加 和 





图 3-7 用 于 数值 相 加 的 ARM 程 序 
3.4 汇编 语言 


ARM 汇 编 语 言 利用 汇编 指示 保护 存储 空间 、 对 地 址 标号 和 常数 标识 符 分 配 数值 、 定 义 程序 和 
数据 块 在 内 存 中 放置 的 位 置 以 及 指明 源 程序 文本 的 结束 位 置 。 这 些 在 2.6.1 节 中 已 经 描述 过 了 。 

图 3-8 通 过 给 出 图 3-7 中 程序 的 一 个 完整 的 源 程序 来 列举 一 些 ARM 的 汇编 指令 。AREA 指 示 符 
使 用 的 参数 是 CODE 或 DATA ， 表 示 包 含 程序 指令 或 数据 的 内 存 块 的 开始 。AREA 指 示 符 实际 上 
需要 更 多 的 说 明 信 息 ， 但 是 这 些 与 我 们 讨论 的 内 容 无 关 。ENTRY 指 示 符 说 明 程 序 的 执行 是 从 
LDR 指 令 开始 的 。 


汇编 指示 


产生 机 器 指令 
的 语句 


NUMI 
3,- 17,27,~ 12,322 





图 3-8 图 3-7 中 程序 的 ARM 汇 编 语言 源 程序 
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在 紧 跟 代 码 区 之 后 的 数据 区 中 ，DCD 指 示 符 是 用 于 标注 和 初始 化 操作 数 的 。SUM 和 N 处 的 
字 在 前 两 个 DCD 指 示 符 处 被 分 别 初 始 化 成 0 和 5。 地 址 NUMI1 利 用 一 个 PCD 指示 符 放 到 POINTER 
指针 处 。 最 后 的 DCD 指 示 符 将 相 加 的 五 个 数 放 到 以 NUMI 开 始 的 连续 内 存 位 置 中 。 
常量 用 十 六 进 制 符号 表示 时 带 有 & 前 级 和 基数 n。 对 于 n 在 2 到 9 时 ， 都 表示 成 n_xxx。 例 如 ， 
2_101100 表 示 一 个 二 进 制 常 量 。 基 数 是 10 的 常量 不 必 带 有 前 缀 。 
EQU 指 示 符 用 于 定义 常量 的 符号 名 称 。 例 如 ， 语 句 
TEN EQU 10 
允许 TEN 代替 十 进 制 常数 10 在 程序 中 使 用 。 当 在 程序 中 使 用 一 个 寄存 器 号 时 ， 利 用 它们 的 符号 名 
称 是 非常 方便 的 。RN 指 示 符 就 是 为 此 目的 而 设置 的 。 例 如 
COUNTER RN 3 
为 寄存 器 R3 建 立 了 COUNTER 名 称 。 寄 存 器 名 称 RO0 到 R15、PC (R15) 以 及 LR (R14) 都 可 以 由 汇 
编程 序 进行 预定 义 。 


伪 指 令 


将 图 3-8 中 地 址 NUM1 装 入 到 寄存 器 R2 中 的 另 一 种 方法 是 可 以 用 汇编 语言 来 实现 。 伪 指令 

ADR Rd, ADDRESS 
将 32 位 ADDRESS 值 装 入 到 Rd 中 。 该 指令 并 不 是 真正 的 机 器 指令 。 汇 编程 序 会 选择 适当 的 机 器 指 
令 来 实现 伪 指令 。 例 如 ， 在 图 3-8 中 使 用 的 机 器 指令 

LDR R2,POINTER 
和 数据 声明 指示 

POINTER DCD NUMI 
的 结合 就 是 实现 伪 指 令 f 
ADR R2 NUMI 


的 一 种 方式 ， 它 将 会 在 程序 中 替换 LDR 指 令 中 的 相应 位 置 。 这 种 情况 下 ， 汇 编程 序 将 需要 为 
DCD 的 声明 分 配 一 个 合适 的 数据 区 。 

在 这 个 特殊 的 例子 中 实现 ADR 指 令 可 能 有 更 有 效 的 方式 ， 这 将 是 由 汇编 程序 来 选择 的 。 在 
ADR 指 令 装 人 地 址 值 时 ，PC (R15) 的 当前 内 容 不 能 超过 255 个 字 节 ， 指 令 


ADD Ra, R15, #offset 


可 以 用 来 实现 ADR 伪 指令 。 如 果 在 这 个 实例 程序 中 这 样 做 的 话 ， 则 不 需要 POINTER 单 元 。 汇 纺 
程序 使 用 真正 的 机 器 指令 来 实现 ADR 伪 指令 : 


ADD R2, R15,#28 


由 于 当 执 行 ADD 指 令 时 的 NUM1 是 28 个 字 节 ， 超 出 了 更 新 后 的 PC 值 ， 这 里 假定 数据 区 紧 跟 在 
STR 指令 的 后 面 。 实 际 上 并 不 是 这 样 的， 因为 STR 指令 后 面 跟着 的 是 将 控制 返回 给 操作 系统 的 指 
令 ， 但 在 这 里 将 其 忽略 了 。 


3.5 1/O 操 作 
ARM 体 系 结构 采用 的 是 在 2.7 节 中 描述 过 的 存储 器 映射 XO。 正 如 在 本 节 中 介绍 的 ， 从 键盘 读 
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取 一 个 字符 或 向 显示 器 发 送 一 个 字符 ， 都 可 以 通过 程序 控制 IO 来 完成 。 
假定 设备 状态 寄存 器 INSTATUS (键盘 ) 和 OUTSTATUS (显示 器 ) 中 的 第 三 位 分 别 包含 着 
控制 标志 SIN 和 SOUT; 同时 假定 键盘 DAIAIN 和 显示 器 DAIAOUT 寄 存 器 紧 跟 在 状态 寄存 器 的 后 
面 ， 位 于 地 址 INSTATUS+4 和 OUTSTATUS+4 处 ; 地 址 INSTATUS 已 经 装 和 人 寄存 器 R1 中 ; 那么 读 
和 写 等 待 循 环 按照 如 下 方式 执行 。 指 令 序列 : 
READWAIT LDR R3,[R1] 
TST R3,#8 
BEQ READWAIT 
LDRB R3, [R1, #4] 


当 键盘 上 有 一 个 键 被 按 下 时 将 该 字符 读 入 到 寄存 器 R3 中 。 测 试 (TST) 指令 将 它 的 两 个 操作 数 进 
行 按 位 逻辑 与 操作 ， 并 根据 结果 来 设置 条 件 码 标志 。 立 即 数 8 在 第 三 位 上 是 1。 因 此 ， 如 果 
INSTATUS 的 第 三 位 是 0(， 则 TST 的 操作 结果 将 是 0; 如 果 第 三 位 是 1 时 ， 结 果 将 是 非 零 ， 这 就 意味 
着 在 DAIAIN 中 有 一 个 字符 存在 。 对 于 BEQ 指 令 ， 如 果 结 果 是 0， 则 转移 返回 到 READWAIT， 一 
直 循 环 直 到 有 按键 被 按 下 将 INSTATUS 的 第 三 位 设置 为 1 时 为 止 。 
假定 地 址 OUTSTATUS 已 经 被 装 入 到 寄存 器 R2 中 ， 指 令 序 列 
WRITEWAIT LDR R4,[R2] 
TST R4,#8 
BEQ WIRTEWAIT 
STRB R3, [R2, #4] 
当 显 示 器 准备 接受 字符 时 将 寄存 器 R3 中 的 字符 发 送 到 DATAOUT 寄 存 器 中 。 
这 两 个 程序 可 以 从 键盘 读 取 一 行 字符 ， 将 它们 存储 到 内 存 中 ， 再 将 它们 显示 在 显示 器 上 ， 
如 图 3-9 中 程序 所 示 。 访 程序 是 图 2-20 中 程序 的 模仿 程序 。 假 设 寄存 器 RO 中 保存 该 行 字符 在 内 存 
中 存储 的 第 一 个 字 节 地 址 ， 寄 存 器 R1 到 R4 与 上 面 描述 的 READWAIT 和 WRITEWAIT 循 环 中 的 用 
法 相同 。 第 一 个 存储 指令 (STRB) 将 从 键盘 读 入 的 字符 存储 到 内 存 中 。 该 指令 中 采用 带 有 写 回 
的 传递 变 址 寻 址 方式 来 遍历 内 存 区 ， 这 类 似 于 图 2-20 中 的 自动 递增 寻 址 方式 的 用 法。 测试 是 否 相 
等 的 指令 (TEQ) 用 来 检测 两 个 操作 数 是 否 相等 ， 并 设置 Z 条 件 码 相应 的 标志 。 


R3,[R1] 载 人 [INSTATUS] 并 等 待 
R3,#8 字符 

READ . 
R3,[R1,#4] 读 取 字 符 并 将 其 保存 在 内 
R3,[R0],#1 存 中 

R4,[R2] 载 入 [OUTSTATUS] 并 等 


R4,#8 待 显示 器 就 绪 

ECHO 

R3,[R2,#4] 向 显示 器 发 送 一 个 字符 
R3,#CR 如 果 没 有 进位 就 返回 ， 继 
READ 续 读 取 字 符 





图 3-9 读 取 一 行 字符 并 进行 显示 的 ARM 程 序 
3.6 子 程序 
转移 与 链接 (BL) 指令 通常 用 于 调用 一 个 子 程序 。 它 的 操作 与 其 他 转移 指令 的 操作 方式 相 
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同 ， 只 是 增加 了 一 步 。 返 回 地 址 (BL 指令 的 下 一 条 指令 地 址 ) 被 装 入 到 R14 ( 它 实 际 上 作为 链接 
寄存 器 使 用 ) 中 。 由 于 子 程序 可 能 是 伐 套 的 ， 所 以 链接 寄存 器 的 内 容 必 须 保 存在 子 程序 使 用 的 
堆栈 中 。 寄 存 器 R13 通常 作为 指向 堆栈 的 指针 。 

图 3-10 是 对 图 3-7 中 的 程序 采用 子 程 序 重 写 的 一 个 程序 ， 参 数 通过 寄存 器 进行 传递 。 调 用 程 
序 利用 寄存 器 R1 和 R2 将 数值 列表 的 大 小 和 第 一 个 数 的 地 址 传送 给 子 程序 ， 子 程序 利用 寄存 器 RO 
向 调用 程序 返回 计算 和 。 该 子 程序 中 还 用 到 了 寄存 器 R3。 因 此 ， 它 的 内 容 连 同 链接 寄存 器 R14 的 
内 容 一 起 使 用 STMFD 指 令 保存 到 堆栈 上 。 该 指令 中 的 后 缀 FD 说 明 堆栈 是 向 低地 址 方向 增长 的 ， 
在 向 堆栈 进行 压 栈 之 前 ， 堆 栈 指针 R13 要 预先 递 碱 。LDMFD 指 令 恢复 寄存 器 R3 中 的 内 容 并 且 将 
保存 的 返回 地 址 弹出 到 PC (R15) 中 ， 自 动 执 行 返回 操作 。 


子 程序 


LISTADD R13!,{R3,R14} 将 R3 和 返回 地 址 保存 到 堆栈 中 的 R14 
中 ，R13 用 作 堆 栈 指针 : 


f RO,#0 
LOOP R3,[R2], #4 
RO,RO,R3 
R1,R1,#1 
LOOP 
LDMFD R13',{R3,R15} 恢复 R3 并 将 返回 地 址 栽 人 PC (R15) 由 





图 3-10 采用 ARM 子 程序 方式 编写 图 3-7 中 的 程序 ， 通 过 寄存 器 传递 参数 


图 3-11a 给 出 的 是 图 3-7 中 的 程序 采用 堆栈 传递 参数 的 子 程序 重 写 的 一 个 程序 ， 调 用 程序 的 前 
四 条 指令 的 作用 是 将 参数 NUM1 和 n 压 入 栈 中 。 我 们 假定 NUM1 中 保存 在 内 存单 元 POINTER 中 ， 
子 程序 中 的 寄存 器 RO 到 R3 与 在 图 3-7 中 的 用 途 相同 。 它 们 的 内 容 连同 R14 中 的 返回 地 址 一 起 由 子 
程序 中 的 第 一 条 指令 保存 到 堆栈 中 。 图 3-1lb 给 出 了 在 不 同时 刻 栈 中 的 内 容 。 在 参数 已 经 压 人 堆 
栈 并 且 执 行 完 调 用 指令 (BL) 之 后 ， 栈 顶 处 于 第 二 级 。 当 子 程序 中 的 第 一 条 指令 将 全 部 的 寄存 
器 保存 完 之 后 ， 栈 顶 处 于 第 三 级 。 下 两 条 指令 利用 堆栈 中 的 20 和 24 字 节 的 偏 移 量 将 参数 装 人 到 
寄存 器 R1 和 R2 中 ， 这 时 分 别 从 第 三 级 到 达 n 和 NUMI1 级 。 这 时 累加 和 已 经 在 R0 中 了 ， 由 Store 指 令 
(STR) 将 R0 插 入 到 栈 中 ， 禾 盖 了 NUM1 的 内 容 。 

子 程序 的 最 后 例子 是 对 由 套 调用 情况 的 处 理 。 图 3-12 给 出 了 图 2-28 中 程序 的 ARM 代 码 。 第 一 
个 和 第 二 个 子 程序 相对 应 的 堆栈 结构 如 图 3-13 所 示 ， 寄 存 器 R12 被 当 作 结 构 指 针 。 为 了 程序 的 可 
读 性 ， 在 本 例 中 一 些 寄存 器 使 用 了 符号 名 称 。 寄 存 器 R12 ( 结构 指针 )、R13 (堆栈 指针 )、R14 
(链接 寄存 器 ) 和 R15 (程序 计数 器 ) 分 别 标注 为 FP、SP、LR 和 和 PC。 汇编 程序 指 示 符 RN 可 以 用 
来 定义 这 些 名 称 。 


iD 








(假定 栈 顶 在 第 一 级 以 下 ) 
调用 程序 
RO,POINTER NUMI 压 人 堆栈 
RO, [R13,# —4]! 
RON n 压 人 堆栈 
RO,[R13,# ~4]! 
LISTADD 
RO,[R13,#4] 把 和 移动 到 内 存单 元 SUM 中 
RO,SUM 
R13,R13,#8 在 堆栈 上 重新 移动 参数 


子 程序 


LISTADD R13!,(R0-R3,R14) 保存 寄存 器 
R1,[R13,#20] 从 堆栈 中 载 人 参数 
R2,[R13,#24] 
RO#0 
R3,[R2],#4 
RO,RO,R3 
R1,R1,#1 
LOOP 
RO,[R13,#24] 把 和 放 入 堆栈 
R131{RO-R3,R15 } ”恢复 寄存 器 并 返回 


a) 调用 程序 和 子 程序 





b) 不 同时 刻 的 栈 顶 


图 3-11 用 ARM 子 程序 编写 图 3-7 中 的 程序 ;采用 堆栈 传递 参数 


调用 程序 和 子 程序 的 结构 与 图 2-28 相 同 。ARM 的 特征 如 下 : 两 个 返回 地 址 和 结构 指针 中 的 
原来 内 容 由 每 个 子 程序 中 的 第 一 条 指令 保存 到 栈 中 ， 第 二 个 指令 将 结构 指针 设置 成 指向 它 所 保 
存 的 值 ， 如 图 3-13 所 示 。 这 是 与 图 2-27 和 图 2-29 中 结构 指针 相 一 致 的 。 于 是 ， 参数 就 可 以 像 通常 
一 样 在 偏 移 量 为 8, 12, … 处 进行 引用 了 。 每 个 子 程序 中 最 后 的 指令 都 是 恢复 结构 指针 和 其 他 使 用 
过 的 寄存 器 的 原来 内 容 ， 以 及 将 从 堆栈 中 弹出 的 返回 地 址 放 到 PC 中 。 
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2100 SUB] 
2104 
2108 
2112 


第 二 个 子 程序 


3000 SUB2 


3.7 实例 程序 
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R10,PARAM2 将 参数 放 人 堆栈 

R10,[SP,# — 4]! 

R10,P ARAM1 

R10,[SP,# - 4]! 

SUBI 

R10,[SP] 保存 SUB1 结 果 

R10,RESULT 

SP,SP,#8 在 堆栈 上 重新 移动 参数 

SP!, {RO0- R3,FP ,LR} ”保存 寄存 器 

FP ,SP,#16 载 人 结构 指针 

RO,[FP ,#8] 载 入 参数 

R1,[FP ,#12] 

R2,P ARAM3 将 参数 放 入 堆栈 

R2,[SP# — 4]! 

SUB2 

R2,[SP],#4 将 SUB2 的 结果 弹出 放 入 R2 

R3,[FP ,#8] 将 结果 放 人 堆栈 

SP!, {R0- R3,FP ,PC } 333228 IHAN 

SP!, {RO,R1,FP LR) 保存 寄存 器 

FP ,SP,#8 载 人 结构 指针 

RO,{FP ,#8] 载 人 参数 

R1,[FP ,#8) 将 结果 放 入 堆栈 

SP!, {RO,R1,FP ,PC | ”恢复 寄存 器 并 返回 
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在 本 节 中 ， 我 们 给 出 第 2 章 描述 过 的 点 积 、 字 节 排 序 和 链表 操作 的 程序 。 这 些 程序 都 是 模仿 
图 2-33、 图 2-34、 图 2-37 和 图 2-38 中 的 通用 程序 所 编写 的 。 我 们 主要 描述 ARM 代 码 与 第 2 章 通 用 


程序 中 不 同 部 分 的 特点 。 
3.7.1 向 量 点 积 程序 


在 图 3-14 中 的 前 两 条 指令 将 A 和 B 向 量 的 地 址 装 入 寄存 器 R1 和 R2 中 。 它 们 是 3.4.1 节 中 描述 的 
ADR 伪 指令 。 如 果 AVEC 和 BVEC 对 于 程序 来 说 足够 接近 ， 那 么 就 可 以 根据 当前 的 PC 值 使 用 加 法 
指令 来 生成 地 址 。 这 里 采用 相对 寻 址 方式 来 访问 N 和 DOTPROD 的 内 容 ， 在 循环 的 前 两 条 指令 中 
使 用 带 有 写 回 的 传递 变 址 寻 址 方式 。 乘 法 累加 指令 (MLA) 执行 必要 的 算术 操作 。 它 将 R4 和 R5 





0 


中 的 向 量 元 素 进行 相 乘 ， 并 将 结果 累加 到 R0 中 。 


I {RO] from SUBI 


个 RHO 的 













paraml 


第 一 个 子 程序 的 堆栈 结构 





Param2 


图 3-13 图 3-12 的 ARM 推 栈 结构 


一 一 UK TL 





R1,AVEC Ri 指向 问 量 A 
R2.BVEC R2 指 向 向 最 B 
R3,N R3 作 为 循环 计数 器 
RO,#0 R0 累 加 点 积 
R4,[R1],#4 载 人 A 元 素 
R5,[R2],#4 栽 入 B 元 素 


RO,R4,R5,RO A、B 元 素 相 乘 ， 结 果 累 加 
到 RO 中 

R3,R3,#1 计数 器 减 1 

LOOP 如 果 没 完成 ， 转 移 返回 

RO,DOTPROD 保存 点 积 





图 3-14 ARM 点 积 程序 
3.7.2 字 节 排序 程序 


图 3-15 所 示 的 是 字 忆 排序 程序 。 它 也 使 用 与 图 2-34b 中 程序 相同 的 结构 。 第 一 个 字 节 LIST 的 地 
址 放 在 寄存 器 R4， 它 用 于 第 二 到 最 后 一 个 比较 指令 中 ， 用 来 检测 内 部 循环 (以 为 变 址 ) 何 时 终 
止 。 相 应 地 ，R5 中 的 地 址 是 LIST+1， 用 于 最 后 的 一 条 比较 指令 来 检测 外 部 循环 (以 j 为 变 址 ) 何 
时 终止 。 基 址 寄存 器 R2 当 作 变 址 j 在 外 部 循环 的 列表 末端 向 回 移动 的 步 长 ， 寄 存 器 R3 当 作 变 址 k 
在 内 部 循环 每 个 子 列表 从 末端 向 回 移动 的 步 长 。 外 部 循环 中 将 LIST ( j ) 字 节 装 入 到 寄存 器 RO， 以 
及 内 部 循环 中 将 LIST (D 字 节 装 入 到 R1， 这 两 种 操作 都 采用 了 带 有 写 回 的 预 变 址 寻 址 方式 

当 LIST (k) 必须 与 LIST (J) 进行 交换 时 ，ARM 指 令 系统 的 条 件 执行 特点 用 于 内 部 循环 中 是 很 
有 优势 的 。 如 果 LIST (k) 比 LIST (7) 大 很 多 (就 像 用 后 级 GT 所 指示 的 那样 ) 时 ， 只 执行 三 条 指令 序 
列 STR、STR 和 MOV。 图 2.34b 中 通用 程序 到 NSXT 的 前 向 条 件 转移 ， 在 ARM 程 序 中 就 不 必 执 行 了 。 
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G= n-i; j> 0;j=j-D 
{ for (k= j-l:k>= 0 k= k- 1) 
[if (LIST[k] > LIST[; D 
{ TEMP = LIST[]; 
LIST[k] = LIST[/]; 


LISTL] = TEMP; 





a) 用 C 语 言 编写 的 排序 程序 


R4,LIST 将 列表 指针 载 入 到 寄存 器 R4 并 初始 

R10,N 化 外 部 循环 基 址 寄存 器 R2 为 LIST + n 

R2,R4,R10 

RS5,R4,#1 HLIST + 1 载 信 R5 

RO,[R2,# - 1]! 将 LIST (j) ARO 

R3,R2 初始 化 内 部 循环 基 址 寄存 器 R3 为 
LIST+n-1 

RILIR3,# - 1]! HLIST k ) 载 入 Rl 

R1,RO XİLIST( k )JHILIST( j ) 作 比较 

R1,[R2] 如 果 LIST( k )>LIST( j )， 将 LIST(& ) 

RO,[R3] HLIST ) 交 换 ， 并 将 (新 的 ) LIST) 

ROR1 移 到 RO 中 

R3,R4 如 果 k>0， 重 复 内 部 循环 

INNER 

R2,R5 如 果 i > 1， 重复 内 部 循环 

OUTER 





b) 用 ARM 实 现 的 程序 
图 3-15 ARM 字 节 排 序 程序 | 


3.7.3 链表 的 插入 和 删除 子 程序 


在 图 3-16 和 图 3-17 中 的 插入 和 删除 子 程序 与 图 2-37 和 图 2-38 中 程序 的 结构 非常 相似 。 在 ARM 
程序 中 并 没有 使 用 普通 的 前 向 条 件 转移 。 这 也 是 使 用 具有 条 件 执行 指令 块 (就 像 图 3-15 中 的 字 节 
排序 程序 一 样 ) 的 结果 。 在 ARM 的 两 个 子 程序 中 都 是 采用 寄存 器 传递 参数 的 。 

这 里 并 没有 采用 寄存 器 的 通常 表示 方法 来 表示 ， 而 是 采用 寄存 器 助 记 符 的 形式 来 说 明 它 的 
HE. 汇编 指示 RN 就 可 以 这 样 理解 。 正 如 图 2-37 和 图 2-38 中 的 程序 ，RHEAD 中 包含 列表 中 第 
一 个 记录 的 地 址 。RNEWREC 中 包含 将 要 插入 的 新 记录 地 址 。RIDNUM 中 保存 着 将 要 删除 记录 
的 地 址 ID， 寄 存 器 RCURRENT 和 RNEXT 中 保存 着 子 程序 遍历 整个 列表 ， 找 到 插入 和 删除 位 置 
的 链接 地 址 。 

图 3-16 中 的 插入 子 程序 是 模仿 图 2-37 中 子 程序 的 ， 它 具有 如 下 的 结构 。 前 三 条 指令 用 来 在 一 
个 空 列 表 中 插入 新 的 表 头 (和 表 尾 )。 假 定 新 记录 最 初 的 链接 字段 是 0， 块 中 的 第 三 条 指令 执行 
的 是 从 子 程序 向 调用 程序 返回 的 操作 。 之 后 的 六 条 指令 判断 新 记录 是 否 要 成 为 当前 链表 的 新 表 
头 ， 链 表 是 按照 ID 号 递增 的 方式 进行 排序 。 因 此 ， 如 果 当 前 头 记录 的 第 一 个 字 的 IP 号 大 于 新 记 
录 的 太 号 时 ， 则 新 记录 就 作为 链表 的 新 表 头 。 如 果 是 这 种 情况 ， 那 么 STRGT 和 MOVGT 的 条 件 执 
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行 指令 执行 相应 的 链接 地 址 操作 。 否 则 ， 子 程序 中 的 其 余部 分 决定 新 记录 应 该 插入 到 当前 表 头 
之 后 的 什么 位 置 上 ， 其 中 包含 新 记录 成 为 表 尾 的 情况 。 

图 3-17 给 出 的 是 删除 子 程序 。 如 果 要 删除 的 记录 是 链表 的 表 头 ， 那 么 前 四 条 指令 用 来 查找 表 头 
位 置 、 删 除 它 并 返回 。 否 则 ， 子 程序 的 其 余部 分 使 用 寄存 器 RCURRENT 和 RNEXT 来 遍历 链表 寻找 
记录 。 当 发 现 由 RNEXT 指 向 的 记录 就 是 要 删除 的 记录 时 ， 使 用 LDREQ/STREQ 指 令 删 除 该 记录 。 

正如 图 2-37 和 图 2-38 中 的 普通 程序 一 样 ， 在 图 3-16 中 ， 插 人 子 程序 假定 新 记录 的 ID 号 与 链表 
中 的 任何 一 个 记录 的 ID 号 都 不 相同 ， 图 3-17 中 的 删除 子 程序 假定 在 链表 中 存在 一 个 ID 号 与 
RIDNUM 中 的 内 容 相同 的 记录 。 习 题 3.23 和 3.24 考 虑 的 是 ， 如 果 假 设 不 成 立 ， 子 程序 将 如 何 修改 
才能 产生 报错 信息 ? 


TEF 


INSERTION ; 检查 列表 是 否 为 空 
如 果 为 空 ， 揪 入 新 记录 作为 表 
类 


如 果 不 为 空 ， 检 查 是 否 新 记录 
成 为 新 表 头 若是 表 头 则 插入 


如 果 新 记录 处 于 在 当前 表 头 之 
后 ， 查 找 其 位 置 


新 记录 成 为 新 表 尾 
继续 与 否 


继续 ， 重 复 循环 


否则 ， 在 当前 记录 之 后 插入 新 
记录 


RNEWREC,[RCURRENT,#4] 
PC,R14 


检查 要 删除 的 记录 是 否 是 表 头 
如 果 是 表 头 ， 则 删除 并 返回 
否则 ， 继 续 查找 

下 一 记录 要 删除 吗 

如 果 是 ， 删 除 并 返回 


人 否则， 循环 返回 继续 查找 





图 3-17 从 链表 中 删除 一 条 记录 的 ARM 子 程序 
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部 分 由 _ 68000 实 例 


在 本 章 的 部 分 II 中 ， 我 们 将 通过 讨论 68000 指令 集 来 描述 Motorola 680X0 系 列 处 理 器 的 基本 
体系 结构 。 该 系列 中 包含 几 款 具有 不 同性 能 级 别 的 处 理 器 。 该 系列 中 所 有 的 成 员 都 具有 相同 的 
基本 体系 结构 ， 但 是 后 期 的 几 款 为 了 提高 性 能 而 增添 了 一 些 特征 。 此 处 使 用 68000 是 由 于 描述 上 
更 加 简便 ， 以 便于 可 以 描述 整个 系列 的 显著 特征 。 我 们 并 没有 对 68000 作 全 面 的 描述 。 对 于 这 些 
信息 ， 读 者 可 以 参考 生产 商 的 信息 四 。 我 们 将 集中 精力 讨论 68000 的 最 重要 特征 ， 并 给 出 充分 的 
细节 让 读者 能 够 编写 并 运行 简单 的 程序 。680X0 系 列 中 各 个 成 员 的 不 同 特征 ， 以 及 一 些 为 提高 性 
能 而 引信 的 特征 将 在 第 11 章 中 描述 。 我 们 将 第 2 章 中 的 程序 用 68000 汇 编 语 言 进行 编写 来 说 明 
68000 体 系 结构 的 各 种 特点 。 130 


3.8 寄存 器 与 寻 址 方式 


68000 处 理 器 的 特点 是 ， 由 于 处 理 器 芯片 中 有 16 条 与 内 存 相连 的 数据 引 脚 ， 所 以 它 有 一 个 16 
位 的 外 部 字 长 。 但 是 数据 的 处 理 是 在 处 理 器 的 32 位 字 长 的 寄存 器 中 进行 的 。 该 系列 中 的 更 先进 
型 号 有 68020、68030 和 68040， 这 些 处 理 器 中 容 入 了 更 大 的 芯片 包 ， 并 具有 32 个 外 部 数据 引 脚 。 
这 样 ， 它 们 可 以 处 理 的 内 部 和 外 部 数据 都 是 32 位 的 。Tatak" 对 680X0 系 列 的 成 员 作 了 描述 ， 并 着 
重 强调 了 68040 这 款 处 理 器 。 


3.8.1 68000 寄 存 器 结构 


如 图 3-18 所 示 ，、，68000 寄 存 器 结构 具有 8 个 数据 寄存 器 和 8 个 地 址 寄存 器 ， 长 度 都 是 32 位 。 数 
据 寄存 器 可 以 作为 通用 累加 器 和 计数 器 来 使 用 。 

68000 指 令 可 以 处 理 三 种 不 同 长 度 的 操作 数 。 其 中 32 位 的 操作 数 占 一 个 “长 字 ”，16 位 操作 
数 占 一 个 “ 字 ”，8 位 操作 数 占 一 个 “ 字 节 ”。 当 一 条 指令 使 用 的 操作 数 是 字 节 或 字 时 ， 操 作 数 要 
放 在 寄存 器 的 低位 部 分 。 在 大 多 数 情况 下 ， 这 种 指令 不 会 影响 寄存 器 中 的 高 位 部 分 ， 但 是 ， 有 
些 指令 将 较 短 的 操作 数 的 符号 位 扩展 到 高 位 部 分 。 

地 址 寄存 器 中 保存 着 用 于 确定 内 存 操作 数 的 信息 。 该 信息 可 以 用 一 个 长 字 或 一 个 字 来 指定 。 
当 一 个 给 定 内 存 位 置 的 地 址 处 于 地 址 寄存 器 中 时 ， 寄 存 器 就 用 作 一 个 指针 来 指向 这 个 位 置 。 此 
外 ， 地 址 和 数据 寄存 器 都 可 以 当 作 变 址 寄存 器 。 地 址 寄存 器 AT 具有 特殊 的 功能 ， 它 是 处 理 器 堆 
栈 的 指针 。 该 寄存 器 的 作用 我 们 在 3.13 节 中 讨论 。 

地 址 寄存 器 和 地 址 的 计算 都 是 32 位 的 。 但 是 在 68000 中 ， 地 址 中 最 低位 开始 的 24 位 用 作 外 部 
对 内 存 的 访问 。68020、68030 和 68040 处 理 器 具有 32 位 的 外 部 地 址 线 和 32 位 的 数据 线 。 

图 3-18 中 所 示 的 最 后 一 个 寄存 器 是 处 理 器 状态 寄存 器 SR。 该 寄存 器 中 有 五 个 条 件 码 位 (在 
3.11.1 节 中 描述 )、 三 个 中 断 位 〈 在 第 4 章 描 述 ) 和 两 个 模式 选择 位 (在 3.13 节 中 描述 )。 


3.8.2 导 址 方式 


68000 计 算 机 的 内 存 是 按照 16 位 的 字 来 组 织 的 ， 同 时 是 字 节 可 寻 址 的 。 两 个 连续 的 字 可 以 看 
作 是 一 个 单个 的 32 位 长 字 。 内 存 中 的 地 址 分 配 如 图 3-19 所 示 。 一 个 字 必 须 从 偶 地 址 开始 ， 也 就 是 
它 的 地 址 必须 是 偶数 ， 所 采用 的 是 big-endian 地 址 分 配方 式 。 一 个 字 中 的 高 位 字 节 具有 和 字 相 同 
的 地 址 ， 但 是 ， 低 位 字 节 的 地 址 是 接 下 来 的 较 高 地 址 。 
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T 一 跟踪 模式 选择 
S 一 管 态 模式 选择 
I 一 中 断 屏蔽 























数据 寄存 器 














地 址 寄存 器 









| 用 户 堆栈 指针 | 
C zemei č | CARE 


~ | 程序 计数 器 








1513 108 4 0 


状态 寄存 器 





图 3-18 68000 寄 存 器 结构 


第 3 重 


由 于 68000 生 成 的 是 24 位 地 址 ， 所 以 它 的 寻 址 空间 为 24 (16777 216 或 16M) 字 节 。 这 个 寻 址 
空间 可 以 看 成 是 由 512 (2°) 个 页 (每 页 有 32K (25) FH) 构成 。 于 是 ， 十 六 进 制 地 址 0 到 7FFF 
构成 第 0 页 ，8000 到 FFFF 构 成 第 2 页 ， 依 次 类 推 。 最 后 一 个 页 由 地 址 FF8000 到 FFFFFF 构 成 。 

68000 中 包含 几 种 寻 址 方式 ， 其 中 包括 在 2.5 节 中 讨论 过 的 内 容 。 很 多 68000 指 令 适合 使 用 16 
位 的 字 , 但 是 有 些 还 需要 额外 的 字 来 保存 额外 的 寻 址 信息 。 指 令 中 的 第 一 个 字 是 操作 码 ， 它 指 
定 了 要 执行 的 操作 以 及 一 些 寻 址 信息 。 其 余 的 寻 批 信息 (WRA) 在 后 续 的 字 中 给 出 。 可 用 的 


寻 址 方式 定义 如 下 : 


立即 方式 一 一 操作 数 包 含 在 指令 中 ， 可 以 指定 四 种 长 度 的 操作 数 。 字 节 、 字 和 长 字 是 紧 跟 在 操 
作 码 之 后 的 。 第 四 种 长 度 的 操作 数 是 由 非常 小 的 数 构成 ， 它 可 以 直接 包含 在 一 些 指令 的 操作 码 中 。 
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绝对 方式 -一 操作 数 的 绝对 地 址 是 在 指令 中 紧 跟 在 操作 码 之 后 的 。 该 方式 有 两 种 版 本 一 一 长 
方式 和 短 方式 。 在 长 方式 中 ，24 位 地 址 是 明确 
指定 的 。 在 短 方式 中 ,指令 给 出 一 个 16 位 的 什 
作为 地 址 的 低 16 位 。 将 该 值 的 符号 位 进行 扩展 ”0 
来 提供 地 址 的 高 位。 由 于 符号 位 是 0 或 1, 所 oa 
以 在 短 方式 中 可 以 访问 的 地 址 空间 只 有 两 个 

页 。 它 们 是 第 0 页 和 第 FF8 页 ， 每 个 容量 是 32K 
字 节 。 

寄存 器 方式 一 -操作 数 在 指令 指定 的 处 理 。 
器 寄存 器 中 。 a2 

寄存 器 间接 方式 一 一 操作 数 的 有 效 地 址 在 
指令 指定 的 地 址 寄存 器 中 。 

Š hi k AAR ERA BOATE | | 
指令 指定 的 地 址 寄存 器 An 中 。 在 操作 数 访问 结 a | yay | 
东 之 后 ，An 中 的 内 容 将 增加 1、2 或 4， 这 要 视 — ~- 
使 用 的 操作 数 是 字 节 、 字 还 是 长 字 而 定 。 图 3-19 68000 中 可 寻 址 单元 图 

自动 递减 方式 -指令 中 指定 的 地 址 寄存 器 An 的 内 容 根据 使 用 的 操作 数 是 字 节 、 字 或 长 字 ， 
而 减 去 1、2 或 4。 操 作 数 的 有 效 地 址 是 An 被 减 值 后 的 内 容 。 

基 址 变 址 方式 一 一 在 指令 中 指定 一 个 16 位 的 带 符号 的 偏 移 量 和 地 址 寄存 器 An。 偏 移 量 与 An 
内 容 的 相 加 和 就 是 操作 数 的 有 效 地 址 。 

完全 变 址 方式 一 指令 中 给 出 一 个 带 符号 的 8 位 偏 移 量 ， 一 个 地 址 寄存 器 An 和 一 个 变 址 寄存 
器 Rk (可 以 是 地 址 或 数据 寄存 器 )。 操 作 数 的 有 效 地 址 是 偏 移 量 与 寄存 器 An 及 RK 内 容 相 加 的 和 。 
在 原 地 址 中 可 以 使 用 完整 的 32 位 ， 或 Rk 的 低 16 位 符号 扩展 方式 的 地 址 。 





字 地 址 


























基 址 相对 方式 一 一 该 方式 与 基 址 变 址 方式 相同 ， 只 是 它 使 用 的 是 程序 计数 器 ， 而 不 是 地 址 寄 
存 器 An。 

完全 相对 方式 一 -该 方式 与 完全 变 址 方式 相同 ， 只 是 它 使 用 的 是 程序 计数 器 ， 而 不 是 地 址 寄 
存 器 An。 


寻 址 方式 及 其 汇编 语法 总 结 在 表 3-2 中 给 出 。 
表 3-2 68000 寻 址 方式 


一 一 


名 称 汇编 语法 寻 址 功能 
立即 #Value Operand = Value 
绝对 短 Valve EA = 符号 扩展 的 WValue 
绝对 长 Value EA = Value 
寄存 器 Rn EA=Rn 
由 Operand = [Rn] 
寄存 器 直接 (An) EA = [An] 
递增 (An)+ EA = [An] 
递增 An 
递减 ~ (An) 递减 An 


EA = [An] 
OC 





m 
w 
+ 


pen 
《An 
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( 续 ) 

名 R 汇编 语法 寻 址 功能 

变 址 基 址 WValue(An) EA = WValue + [ An] 

变 址 完全 BValue(An, Rk.S) EA = BValue + [ An ] + [ RK] 

相对 基 址 WValue(PC) EA = WValue + [ PC ] 

， 或 Label 
相对 完全 BValue(PC, Rk.S) EA = BValue + [ PC] + [RN 
或 Label(Rk) 
EA = 有 效 地 址 


Value = 明确 给 出 或 用 标号 表示 的 数 

BValue = 8 位 

WValue = 16 位 

An = 地 址 寄存 器 

Rm = 地址 或 数据 寄存 器 

S= KRETA: W 表 示 符 号 扩展 的 16 位 字 ， 工 表示 32 位 长 字 


注意 有 两 个 版 本 的 变 址 方式 ， 基 址 变 址 方式 与 图 2-13 描 述 的 方式 相对 应 。 完 全 变 址 方式 包括 
指令 中 的 两 个 寄存 器 的 内 容 和 一 个 偏 移 常量 。 偏 移 常量 的 长 度 在 基 址 方式 中 是 16 位 ， 在 完全 方 
式 中 是 8 位 。 

在 完全 变 址 方式 中 ， 第 二 个 寄存 器 RE 有 两 种 使 用 方式 : 使 用 全 部 32 位 或 只 使 用 其 中 的 低 16 
位 。 通 过 在 寄存 器 名 称 后 面 加 上 一 个 长 度 指示 符 来 指示 汇编 程序 所 使 用 的 是 何 种 方式 一 -世代 表 
长 字 ，W 代 表 字 ,例如 ，D1.L 或 D1.W。 如 果 不 给 出 提示 ， 默 认 的 方式 就 是 后 一 种 情况 。 在 计算 
一 个 32 位 有 效 地 址 时 所 使 用 的 是 一 个 16 位 的 字 ， 要 将 这 个 字 进 行 符号 扩展 。 

在 两 种 变 址 方式 中 ， 都 可 以 使 用 程序 计数 器 来 代替 地 址 寄存 器 。 寻 址 方式 称 为 相对 导 址 方 
式 ， 因 为 有 效 地 址 是 以 操作 数 与 涉及 到 该 操作 数 的 指令 之 间 的 距离 形式 指定 的 。 考 虑 指令 

ADD 100 (PC, Al ), DO 


当 编 码 成 机 器 指令 形式 时 ， 该 指令 由 两 个 字 构 成 。 操 作 码 说 明 这 是 一 条 加 法 指令 ， 目 标 寄存 器 
是 数据 寄存 器 D0， 原 操作 数 使 用 的 是 完全 相对 寻 址 方式 。 第 二 个 字 也 称 为 扩展 字 (extension 
word)， 说 明 寄存 器 Al 用 作 变 址 寄存 器 ， 其 中 包含 8 位 的 偏 移 量 值 100。 
假定 前 面 的 指令 保存 在 1000 处 ， 寄 存 器 A1 包 含 的 值 是 6， 如 图 3-20 所 示 。 当 该 指令 的 操作 码 
已 经 取出 并 由 处 理 器 对 其 进行 编码 的 时 候 ， 程 序 计数 器 指向 扩展 字 ， 这 就 意味 着 程序 计数 器 中 
的 值 是 1002。 因 此 ， 原 操作 数 的 有 效 地 址 是 : 
EA=[PC]+[ A1]+ 100 
= 1002 + 6 + 100 
= 1108 
图 3-20 指 出 了 使 用 这 种 寻 址 方式 是 如 何 访问 数组 中 的 一 个 数据 项 的 。 偏 移 量 说 明了 在 数组 中 的 第 
一 项 与 指令 的 距离 。 之 后 ， 变 址 寄存 器 给 出 了 那 一 点 到 所 需 操作 数 (在 数组 中 的 第 四 个 字 ) 的 
距离 。 
我 们 使 用 了 明确 的 格式 给 出 了 相对 寻 址 方式 。 大 多 数 的 汇编 程序 允许 使 用 更 加 简单 的 形式 
来 指定 这 种 寻 址 方式 。 首 先 ， 必 须 通过 一 个 适当 的 汇编 指示 提示 汇编 程序 ， 在 程序 中 某 个 给 定 
的 部 分 中 使 用 了 相对 寻 址 方式 。 之 后 ， 在 名 称 ARRAY 已 经 分 配 了 一 个 值 1102 以 后 ， 图 3-20 中 的 
指令 就 可 以 写成 
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ADD ARRAY (A1), DO 


汇编 程序 将 该 源 操作 数 解释 为 使 用 完全 相对 寻 址 方式 ， 并 按照 图 中 指示 的 那样 计算 偏 移 量 。 汇 
编程 序 不 知道 (也 无 需 知道 ) 在 执行 指令 时 寄存 器 Al 中 的 内 容 。 例 如 该 指令 可 以 用 在 一 个 程序 
循环 中 ， 在 这 种 情况 下 A1 可 以 用 来 访问 数组 中 的 连续 元 素 。 

完全 相对 寻 址 方式 中 ， 由 于 偏 移 量 采用 8 位 补 码 值 来 表示 ， 因 此 它 的 值 限 定 在 - 128 到 
+127 之 间 。 





图 3-20 对 于 指令 ADD 100 (PC, A1 ), DO, 68000 完 全 相对 寻 址 方式 的 例子 


3.9 指令 


68000 ISA 提 供 了 一 个 广泛 的 指令 系统 ， 其 中 的 大 部 分 指令 可 以 操作 三 种 不 同 长 度 的 操作 数 。 
附录 C 给 出 了 指令 系统 的 总 结 。 大 部 分 的 指令 可 以 按照 统一 的 方式 使 用 所 有 的 寻 址 方式 。 指 令 的 
这 一 特征 称 为 正 交 。 | 

68000 具 有 单 操作 数 和 双 操 作 数 指令 。 一 个 双 操 作 数 指令 写 为 : 

OP src, dst 
该 指令 使 用 源 操作 数 和 目标 操作 数 来 执行 操作 OP， 结 果 保存 在 目标 单元 中 。 图 3-21 给 出 了 一 个 
例子 ， 其 指令 是 : 
ADD #9,D3 
该 指令 完成 的 动作 是 : 
dst- [ src ] + [ dst ] 137 
它 的 结果 是 将 值 9 与 寄存 器 D3 的 内 容 相 加 并 将 结果 保存 到 D3 中 。 

图 3-21a 描 述 的 是 ADD 指 令 的 一 般 格式 。 其 中 的 源 操 作 数 或 目标 操作 数 中 的 一 个 必须 在 数据 
寄存 器 Dn 中 。 第 二 个 操作 数 可 以 在 寄存 器 中 ， 也 可 以 在 一 个 内 存单 元 中 。 在 表 C-4 中 给 出 了 允许 
的 组 合 说 明 。 由 于 两 个 操作 数 中 译 少 有 一 个 使 用 了 8 个 数据 寄存 器 中 的 一 个 ， 所 以 3 位 标识 字段 
就 足够 用 了 。 其 他 的 操作 数 根据 表 C-1 中 的 说 明 来 指定 。 在 我 们 的 例子 中 ， 目 的 寄存 器 D3 用 9 到 
11 位 的 二 进 制 形式 表示 成 011; 源 操作 数 是 立即 数 ， 用 第 0 到 第 5 位 的 111100 的 形式 来 标识 。 

所 需 操 作 数 的 长 度 使 用 2 位 字段 来 标明 。 在 例子 中 ， 操 作 数 的 长 度 没有 在 汇编 语言 语句 中 明确 
标明 ， 这 种 情况 下 汇编 程序 假设 的 默认 值 是 16 位 字 。 根 据 表 C-3， 字 长 度 的 操作 数 以 01 形 式 来 指示 。 
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通过 上 面 的 讨论 ，ADD 指 令 的 操作 码 就 是 1101011001111100， 用 十 六 进 制 表示 就 是 D67C , 
如 图 3-21b 所 示 。 


i5 1211 98765 0 


"1 
ioi da | se Í 


Sm sonore, si 


T | 


操作 三 
a) ADD 指 令 的 操作 码 字 的 格式 


二 进 制 1101011001111100 
十 六 进 制 D 6 7 cC 


b) 操作 码 字 的 编码 
| 
i ， D67C 操作 码 字 
i+2 T 9 立即 操作 数 
i+4 Í 7 1 
D3 | S 2 | D3 [ — 3 | 
PC | : | e ra | 
指令 取出 之 前 指令 执行 之 后 
c) 指令 执行 结果 


图 3-21 68000 指 令 ADD #9,D3 


源 操作 数 是 立即 数 9， 紧 跟 在 操作 码 之 后 给 出 ， 如 图 3-21c 所 示 。 在 取 指令 之 前 ， 程 序 计数 器 
指向 操作 码 的 地 址 i。 在 从 内 存 中 每 次 取出 一 个 字 时 ，PC 的 内 容 增加 2。 这 样 ， 当 指令 执行 完成 
时 ，PC 指 向 下 一 条 指令 的 操作 码 的 地 址 i + 4。 

采用 相同 格式 的 另 一 条 类 似 指令 是 减法 指令 SUB， 执 行 的 操作 

dst~[dst]—[src] 
正如 表 C-4 所 示 ，ADD 和 SUB 指 令 可 以 对 两 个 操作 数 中 的 一 个 进行 非常 灵活 的 指定 。 但 是 ,第 二 个 
操作 数 必须 放 在 数据 寄存 器 中 。 大 多 数 其 他 的 双 操作 数 指令 具有 同样 类 型 的 限制 。 只 有 一 条 指令 ， 
它 的 两 个 操作 数 可 以 采用 大 多 数 的 寻 址 方式 来 指定 、 该 指令 就 是 传送 指令 MOVE， 它 执行 的 动作 是 


dst- [ src ] 
现在 考虑 一 个 简单 的 C~ [A] + [B] 的 任务 ， 如 图 2-8 所 示 。 要 求 的 任务 可 以 按照 如 下 方式 执行 
MOVE A, D0 


ADD B,DO 
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MOVE D0, C 
这 些 指令 可 能 存储 在 68000 计 算 机 的 内 存 中 ， 如 图 3-22 所 示 。 图 中 将 地 址 和 操作 数 的 值 用 十 六 进 


制 来 表示 。 假 定 操作 数 长 度 是 16 位 ， 它 们 的 
地 址 采用 绝对 寻 址 方式 来 指定 。 注 意 ， 由 于 
所 需 的 地 址 不 能 表示 成 16 位 的 形式 ， 所 以 应 
该 使 用 绝对 寻 址 方式 中 的 长 寻 址 方式 。 根 据 
图 3-19 中 的 约定 ， 将 32 位 地 址 中 的 高 16 位 放 到 
低地 址 字 中 ， 低 16 位 放 到 高 地 址 字 中 。 


3.10 汇编 语言 


在 2.6 节 中 讨论 的 汇编 语言 通常 也 适用 于 
68000 汇 编 语言 。 这 里 主要 阐述 一 些 细微 的 不 
同 之 处 和 额外 的 部 分 。 

由 于 68000 指 令 可 以 处 理 三 种 不 同 长 度 的 
操作 数 ,所 以 汇编 指令 必须 要 指定 所 需 的 长 度 。 
通过 在 操作 助 记 符 的 后 面 加 上 长 度 指 示 符 来 实 
现 这 种 功能 。 长 度 指示 符 中 的 L 表 示 长 字 ，W 
表示 字 ，B 表 示 字 节 。 因 此 ， 如 果 加 法 指令 使 
用 的 操作 数 是 一 个 长 字 ， 其 操作 助 记 符 就 写作 
ADD.L。 如 果 不 给 出 长 度 指示 ， 那 么 操作 数 的 
长 度 就 是 一 个 字 。 这 就 意味 着 指令 ADD.W 
#20, D1 与 指令 ADD #20, Dl 是 相同 的 。 

除非 使 用 十 六 进 制 前 级 $ 或 二 进 制 前 级 %， 


C = 202200 


| 





A= 201150 639,0 
B = 201152 


201200 ; 


201202 ;i MOVE A,D0 


: "Ë B,DO 


| i MOVE D0,C 


201206 
201208 
20120A 
20120C 
20120E 
201210 





执行 之 后 , [202200] = 424 


图 3-22 C-[A]+{B ] 的 68000 程 序 


否则 程序 中 的 数值 都 假定 使 用 十 进 制 来 表示 。 汇 编程 序 将 单 引号 之 间 的 字母 数字 字符 用 它们 对 
应 的 ASCII 码 来 替换 。 引 号 之 间 的 一 个 字符 串 中 可 以 有 多 个 字符 。 例 如 ， 字 符 串 “STRING3， 就 


是 一 个 有 效 字符 申 。 


在 2.6 节 中 讨论 的 全 部 汇编 指示 除了 在 名 称 上 有 少许 的 不 同 之 外 都 可 以 使 用 。 指 令 或 数据 块 
的 起 始 地 址 采用 ORG 指示 符 来 指定 。EQU 指 示 符 相当 于 数值 的 名 称 。 采 用 DC (Define Constant) 
指示 符 将 数据 常量 来 插入 到 一 个 目标 程序 中 。 指 示 符 后 面 所 跟 的 长 度 标识 是 专门 用 来 说 明 数 据 
项 的 长 度 ， 一 个 指示 符 可 以 定义 多 个 数据 项 。 例 如 指示 符 
ORG 100 
PLACE DC.B 23, $4F, %10110101 
结果 是 将 十 六 进 制 值 17(231)、4F 和 B5 分 别 装 入 到 内 存 中 的 100、101 和 102 中 。 标 号 PLACE 被 分 


配 的 值 是 100。 


内 存 块 可 以 通过 DS (Define Storage) 指示 符 来 预 留 。 例 如 指示 符 
ARRAY DS.L 200 


将 200 个 长 字 的 空间 预 留 出 来 ， 同 时 将 第 一 个 长 字 的 地 址 和 名 称 ARRAY 关 联 起 来 。 
在 图 3-23 中 给 出 的 是 对 应 于 图 3-22 的 一 个 68000 汇 编 语言 程序 的 简单 例子 。 
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地 址 或 数 
据 信 息 


$202200 
$201150 
639 
-215 
$201200 
生成 机 器 指令 的 语句 A,D0 
B.D0 
DO,C 


汇编 指示 


图 3-23 用 68000 汇 编 语言 表示 的 图 3-22 中 的 程序 


3.11 程序 流 控 制 


转移 指令 是 用 来 实现 程序 结构 的 ， 如 if 语句 与 循环 。 通 常 ， 转 移 指令 要 测试 一 个 转移 条 件 ， 
并 根据 测试 结果 转向 一 条 或 两 条 可 能 的 路 径 继续 执行 。 油 试 的 条 件 与 刚刚 执行 的 操作 结果 有 关 。 


3.11.1 条 件 码 标志 


68000 中 有 五 个 存储 在 状态 寄存 器 中 的 条 件 码 标志 ， 如 图 3-18 所 示 。68000 中 除了 有 在 2.4.6 节 
中 描述 的 N、Z、V 和 C 标 志 以 外 ， 还 有 第 五 个 标志 X (扩展 )。 它 的 设置 方式 与 C 标 志 相 同 ， 但 是 
它 不 受 任何 指令 的 影响 。 当 我 们 进行 高 精度 操作 时 ， 这 种 表面 上 的 复制 确实 非常 方便 ， 这 些 内 
容 我 们 将 在 第 6 章 中 介绍 。 

附录 C 中 的 表 C-4 给 出 了 每 条 指令 会 影响 哪些 标志 。 如 果 有 进位 时 将 C 和 X 标 志 设 置 成 1， 它 
们 是 加 法 操作 执行 结果 中 最 重要 的 位 。 在 执行 一 条 减法 指令 中 没有 进位 时 , 将 C 和 X 标 志 设 置 成 1， 
代表 借 位 信号 。 由 于 操作 数 可 以 说 明成 三 种 长 度 中 的 任何 一 种 ， 所 以 这 两 个 标志 位 要 分 别 依赖 
于 字 节 、 字 或 是 长 字 对 应 的 来 自 于 第 7、15 和 31 位 上 的 进位 。MOVE 指 令 根 据 传送 的 操作 数 来 设 
置 N 和 Z 标 志 ， 并 清除 C 和 V 标 志 。 除 非 指定 的 目标 是 状态 寄存 器 本 身 ， 否 则 MOVE 指 令 不 会 影响 
X 标 志 位 。 


3.11.2 转移 指令 


在 条 件 转移 指令 中 ， 如 果 条 件 满 足 ， 那 么 条 件 转移 指令 就 继续 执行 转移 目标 地 址 处 的 指令 。 
这 个 转移 目标 地 址 由 操作 数字 段 中 的 转移 偏 移 量 决定 。 否 则 ， 如 果 转 移 条 件 不 满足 ， 那 么 将 执 
行 紧 跟 在 转移 指令 之 后 的 指令 。68000 给 出 了 两 类 偏 移 量 的 转移 指令 。 第 一 类 是 包含 在 操作 码 字 
中 8 位 的 短 偏 移 量 。 这 些 指令 用 于 计算 转移 地 址 时 程序 计数 器 中 的 值 是 +127 或 - 128 以 内 的 转移 
目标 地 址 。 回 想 一 下 ， 从 内 存 中 每 次 取出 一 个 字 了 时 ，PC 的 内 容 就 会 增加 ， 这 就 意味 着 偏 移 量 定 
义 的 是 紧 跟 在 转移 指令 操作 码 之 后 的 字 之 间 的 距离 。 第 二 类 是 16 位 的 偏 移 量 ， 紧 跟 在 操作 码 之 
后 的 字 中 。 访 类 型 为 转移 目标 的 定位 提供 了 更 大 的 范围 ( + 32K )。 此 时 ， 偏 移 量 是 扩展 字 到 转 
移 目 标 之 间 的 距离 。 

图 3-24 说 明 的 是 短 偏 移 量 转移 指令 的 用 法 。 图 中 给 出 了 图 2-16 的 程序 循环 是 如 何在 68000 处 
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理 器 上 实现 的 。 注 意图 2-16 中 的 程序 使 用 的 是 减 1 指 令 。 由 于 68000 中 没有 这 种 指令 ， 我 们 使 用 的 
是 快速 减法 指令 SUBQ， 该 指令 是 从 寄存 器 D1 中 减 去 立即 数 1。 一 个 3 位 的 立即 操作 数 包含 在 
SUBQ 指 令 的 操作 码 中 ; 这 样 只 需 一 个 字 就 可 以 表示 这 条 指令 。 

68000 有 16 个 条 件 转移 指令 ， 每 条 指令 都 可 以 带 8 位 和 16 位 的 偏 移 量 。 同 时 还 有 一 个 非 条 件 
转移 指令 BRA ， 它 的 转移 总 是 满足 的 。 表 C-$ 和 表 C-6 中 给 出 了 这 些 指令 的 详细 内 容 。 


15 8 7 0 
转移 地 址 =[ 更 新 的 PC ] + 偏 移 量 
a 短 含 移 其 转移 指令 的 格式 


LOOP 1000 | — LOOP ADDW (A2+DO 


1002 





1004 BGT LOOP 
1006 
—  . 
内 存 中 循环 的 情况 循环 的 汇编 语言 版 本 


当 计 算 转移 地 址 时 ，[ PC ] = 1006 
转移 地 址 = 1006 - 6 = 1000 
b) 在 图 2-16 的 循环 中 使 用 转移 指令 的 例子 
图 3-24 68000 短 偏 移 量 转移 指令 142 


图 3-25 给 出 了 采用 68000 编 写 的 图 2-16 中 的 加 法 程序 。 程 序 中 分 别 使 用 数据 寄存 器 DO 和 D1 作 
为 累加 器 与 计数 器 ， 使 用 地 址 寄存 器 A2 指 向 从 内 存 中 取出 来 的 操作 数 。 注 意 由 于 在 自动 递增 寻 
址 方式 中 只 人 允许 使 用 地 址 寄存 器 ， 所 以 这 里 使 用 了 地 址 寄存 器 。 


N 包 含 *，n 是 要 相 加 的 项 的 个 数 ，D1 
用 作 决 定 循环 执行 次 数 的 计数 器 


#NUM1,A2 A2 用 作 指 向 表 项 的 指针 。 其 初始 化 
时 指向 NUM1， 第 一 个 项 的 地 址 

DO D0 用 作 累 计 相 加 和 

(A2)+,D0 与 DO 相 加 的 连续 的 数值 

#1,D1 计数 器 减 1 

LOOP 如 果 fD1]*0， 再 次 执行 循环 


D0,SUM 把 和 保存 到 SUM 中 





图 3-25 采用 68000 编 写 的 图 2-16 中 的 加 法 程序 
递减 和 转移 指令 
68000 中 除了 一 些 通 常 的 转移 指令 以 外 ， 还 有 一 套 更 加 复杂 的 包含 着 计算 机 制 的 指令 。 这 些 
技巧 对 于 实现 循环 控制 是 非常 有 用 的 。 这 些 指令 使 用 下 面 的 格式 





等 价 于 序列 
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DBcc Dn, LABEL 


其 中 的 后 组 表示 转移 条 件 。 例 如 ， 如 果 采 用 GT 来 代替 ccc， 那么 只 有 是 “大 于 ”指令 时 ， 指 令 
DBGT 将 递减 并 转移 。 在 表 C-6 中 给 出 了 全 部 可 能 转移 指令 。 这 些 指令 中 的 条 件 转移 使 用 方式 与 
其 他 转移 指令 中 的 使 用 方式 相反 。 其 行为 如 下 : 

如 果 cc 指 定 的 条 件 满 足 ， 那 么 立即 执行 在 DBcc 指 令 之 后 的 指令 。 

如 果 cc 指 定 的 条 件 不 满足 ， 寄 存 器 Dn 中 最 低 16 位 减 1。 如 果 结 果 等 于 - 1， 下 一 步 就 执行 
DBcc 指 令 之 后 的 指令 。 如 果 结果 不 等 于 - 1， 转 移 指令 转向 在 LABEL 处 的 指令 。 

由 于 DBcc 指 令 决定 是 否 转移 取决 于 两 个 条 件 而 不 是 一 个 条 件 ， 所 以 它 的 功能 比 普通 的 转移 
指令 更 加 强大 。 如 果 使 用 普通 的 转移 指令 来 完成 同样 的 动作 ， 必 须 使 用 三 条 指令 的 序列 来 完成 : 
首先 ， 用 一 个 转移 指令 来 检测 cc 条 件 ; 然后 ， 使 用 一 个 将 计数 器 内 容 减 1 的 指令 ; 最 后 ， 再 用 一 
条 转移 指令 根据 减 1 操作 的 结果 来 决定 是 否 转移 。 例 如 ， 指 令 

DBcc D3, LOOP 
下 一 指令 


Bc NEXT 

SUBQ #1,D3 

BGE LOOP 
NEXT 下 一 指令 

考虑 DBcc 指 令 一 种 非常 有 用 的 方式 是 将 它 看 成 提供 循环 控制 的 简便 手段 ， 当 给 定 的 条 件 满 
足 时 可 以 较 早 地 从 循环 中 退出 。 循 环 执行 的 次 数 是 由 计数 器 寄存 器 中 的 内 容 限 制 的 ， 在 前 面 给 
出 的 例子 中 就 是 D3 

一 个 DBcc 指 令 DBF (如 果 条 件 是 FALSE 就 递减 并 转移 )， 使 用 的 测试 条 件 总 是 FALSE。 这 样 ， 
决定 是 否 执行 转移 仅仅 基于 计数 器 寄存 器 的 内 容 递 减 之 后 的 结果 。 一 个 循环 总 是 执行 预先 定义 
的 次 数 是 非常 有 用 的 。 它 还 有 第 二 个 名 字 DBRA (递减 并 总 是 转移 )。 

为 了 说 明 递 碱 和 转移 指令 的 作用 ， 我 们 将 图 3-25 中 的 程序 采用 DBRA 指 令 重 新 编写 ， 如 图 3-26 
所 示 。 寄 存 器 D1 初始 化 为 图 3-25 中 的 值 n%。 但 是 ， 由 于 当 计 数 器 寄存 器 中 的 内 容 等 于 或 大 于 0 时 ， 
DBRA 指 令 才 执行 转移 ， 所 以 在 图 3-26 中 的 寄存 器 D1 被 初始 化 成 x - 1。 两 个 程序 中 具有 相同 的 指 
令 总 数 ， 但 图 3-26 中 的 程序 由 于 使 用 的 循环 更 短 ， 所 以 使 得 程序 的 执行 时 间 也 更 短 。 


N,D1 in- ! 放 入 计数 器 寄 
#1,D1 FADI 

#NUMLA2 

DO 


(A2)+,D0 
D1,LOOP 循环 直至 [D1]= -1 
DO,SUM 





图 3-26 图 3-25 中 程序 的 另 一 个 可 选择 的 68000 程 序 
3.12 IO 操作 
68000 处 理 器 所 需 的 IO 设备 接口 中 的 全 部 状态 和 数据 缓冲 区 ， 都 是 像 内 存 一 样 是 可 寻 址 的 。 
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这 就 意味 着 68000 计 算 机 中 的 程序 控制 JO 可 以 按照 2.7 节 中 一 般 的 讨论 内 容 来 实现 。 
假设 键盘 状态 寄存 器 INSTATUS 的 b 位 包含 输入 控制 标志 SIN。 从 键盘 的 输入 操作 通过 下 面 
的 指令 序列 来 实现 
READWAIT BTSTW #3,INSTATUS 
BEQ READWAIT 
MOVE.B DATAIN, D1 
按 位 检测 指令 BTST 检 测 目标 操作 数 中 一 位 的 状态 ， 并 设置 条 件 码 标志 Z。 在 本 例 中 ， 被 检测 位 
的 位 置 是 在 第 一 个 操作 数 中 指定 的 。 
假设 显示 状态 寄存 器 OUTSTATUS 中 的 bh 位 包含 输出 控制 标志 SOUT， 可 以 通过 下 面 的 指令 
序列 将 寄存 器 D1 中 的 字符 发 送 到 显示 器 : 
WRITEWAIT BTSTW #3,OUTSTATUS 
BEQ WRITEWAIT 
MOVE.B D1, DATAOUT 
一 个 从 键盘 读 取 一 行 字符 并 将 它们 保存 到 内 存 ， 然 后 将 它们 在 显示 器 上 显示 的 68000 程 序 如 
图 3-27 所 示 。 这 个 程序 是 模仿 图 2-20 中 的 程序 编写 的 。 程 序 中 假定 遇 到 回 车 时 一 行 结束 。 字 符 保 
存在 内 存 中 以 LOC 为 起 始 地 址 的 字 节 处 。 


MOVEA.L #LOC,A1 初始 化 指针 寄存 器 Ali， 使 其 保存 字符 在 
内 存 中 存储 位 置 的 起 始 地 址 


BTSTW #3, INSTATUS 等 待 -- 个 字符 输入 人 到 键盘 缓 串 DATAIN 中 

BEQ READ 

MOVEB DATAIN,(AD 把 DAIAIN 中 的 字符 转移 到 内 存 中 (这 将 
青 SIN 为 0 ) 


BTSTW 要 ,OUTSTATUS 等 待 显 示 器 就 绪 

BEQ ECHO 

MOVE.B (A1)DATAOUT 将 刚刚 读 和 的 字符 移 到 输出 缓 神 寄存 器 
中 (这 将 清 SOWT 为 0) 

CMPI.B #CR, (AD+ 检查 刚 读 入 的 字符 是 否 为 CR ( 回 车 )， 
如 果 不 是 CR， 转 移 返 回 ， 读 取 下 一 个 字符 。 

BNE READ 同时 增加 指针 以 指向 下 一 个 字符 





图 3-27 读 取 一 行 字符 并 进行 显示 的 68000 程 序 


3.13 堆栈 和 子 程序 


堆栈 可 以 像 2.8 节 中 说 明 的 那样 使 用 任何 一 个 地 址 寄存 器 作为 指针 来 实现 。 自 动 递增 与 自动 
递减 寻 址 方式 使 得 这 个 过 程 更 加 简便 。 一 个 特殊 的 寄存 器 A7 被 设计 成 为 处 理 器 堆栈 指针 ， 并 且 
该 处 理 器 指向 的 堆栈 称 为 处 理 器 堆栈 。 就 是 这 个 栈 用 在 了 处 理 器 自动 执行 的 所 有 堆栈 操作 中 ， 
例如 在 子 程序 链接 情况 下 。 

图 3-18 中 给 出 的 两 种 不 同 的 32 位 寄存 器 A7 。68000 提 供 了 两 种 不 向 的 操作 模式 ， 用 户 模式 和 
管 态 模式 。 每 种 模式 中 都 有 自己 的 处 理 器 堆栈 指针 A7。 在 管 态 模式 中 ， 处 理 器 可 以 执行 全 部 的 
机 器 指令 。 在 用 户 模式 中 不 可 以 执行 那些 特权 指令 。 应 用 程序 通常 在 用 户 模式 下 运行 ， 而 系统 
软件 则 使 用 管 态 模式 。 处 理 器 状态 寄存 器 中 的 S 位 决定 两 种 模式 中 的 哪 一 种 处 于 活动 状态 ， 也 就 
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是 说 ， 当 前 使 用 的 是 两 个 A7 寄 存 器 中 的 哪 一 个 。 

转移 到 子 程序 (Branch-to-Subroutine, BSR) 指令 用 于 子 程序 的 调用 。 它 的 实现 方式 与 其 他 
转移 指令 相同 ， 但 也 会 将 程序 计数 器 的 内 容 压 人 栈 中 。 它 的 转移 目的 地 址 是 子 程序 中 的 第 一 条 
指令 。 当 子 程序 结束 时 ， 使 用 一 条 从 子 程序 返回 指令 (RTS) 返回 到 调用 程序 中 ， 将 栈 顶 的 返回 
地 址 弹出 到 程序 计数 器 中 。BSR 和 RTS 指 令 人 允许 子 程序 链接 机 制 得 以 实现 ， 这 部 分 在 2.9 节 中 有 一 
般 性 的 描述 。 

图 3-28 给 出 了 如 何 使 用 子 程序 编写 图 3-26 中 的 程序 ， 并 通过 寄存 器 来 传送 参数 。 列 表 地 址 与 
表 中 的 项 数 是 通过 寄存 器 A2 和 D1 传送 给 子 程序 的 。 在 执行 完 加 法 之 后 ， 子 程序 返回 寄存 器 DO 中 
的 和 。 

图 3-29 给 出 了 如 何 使 用 子 程序 编写 图 3-26 中 的 程序 ， 通 过 寄存 器 A7 指 向 的 堆栈 来 传送 参数 。 
MOVEM (传送 多 个 寄存 器 ) 指令 保存 和 恢复 寄存 器 A2、D1 和 D0。 这 些 寄存 器 在 堆栈 中 的 保存 
顺序 ， 如 图 3-29b 所 示 。 第 一 个 MOVEM 指 令 使 用 自动 递减 寻 址 方式 ， 将 指定 的 寄存 器 压 和 人 栈 中 。 
第 二 个 MOVEM 指 令 使 用 自动 递增 寻 址 方式 将 堆栈 中 保存 的 值 弹 出 ， 并 将 它们 按照 相反 的 顺序 保 
存 到 寄存 器 中 。 

现在 考虑 子 程序 嵌 套 的 情况 ， 其 中 一 个 子 程序 调用 另 一 个 子 程序 ， 如 图 2-28 中 所 示 。 图 3-30 
给 出 了 这 个 例子 的 68000 代 码 ， 子 程序 SUB1 和 SUB2 的 堆栈 结构 如 图 3-31 所 示 。 主 程序 调用 子 程 

序 SUB1。 在 调用 指令 BSR 执 行 之 前 ， 主 程序 将 SUB1 要 使 用 的 参数 param2 和 param1 压 入 栈 中 。 


将 地 址 NUM1 放 到 A2 中 
将 项 数 上 放 到 D1 中 
调用 子 程序 LISTADD 
将 和 存 到 SUM 中 


子 程序 


LISTADD #1,D1 调整 计数 为 n -1 
DO 

LOOP (A2)+,D0 在 DO 中 累积 和 
D1,LOOP 





图 3-28 将 图 3-26 中 的 程序 编写 成 一 个 68000 子 程序 ， 通 过 寄存 器 传递 参数 
子 程序 通过 创建 自己 的 堆栈 结构 开始 。 特 定 指令 
LINK Ai,#disp 

将 寄存 器 Ai 设置 为 结构 指针 ， 并 执行 如 下 操作 : 

1. 将 寄存 器 Ai 的 内 容 压 和 处理 器 栈 中 。 

2. 将 处 理 器 堆栈 指针 A7 的 内 容 复 制 到 寄存 器 Ai 中 。 

3. 将 指定 的 位 移 量 加 到 寄存 器 A7 中 。 
如 果 位 移 量 是 一 个 负数 ， 将 会 导致 栈 顶 向 上 移动 (低地 址 方向 )， 这 样 ， 就 创建 了 子 程序 中 
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局 部 变量 使 用 的 空 堆栈 空间 。 这 些 变量 可 以 采用 结构 指针 寄存 器 Ai 的 变 址 寻 址 方式 来 访问 。 
在 子 程序 的 最 后 ，UNLK ( 断 开 连接 ) 指令 与 LINK 指 令 的 动作 相反 。 它 把 Ai 装 到 A7 中 ,这 
样 ， 降 低 栈 顶 回 到 与 偏 移 量 相 加 之 前 的 位 置 ， 然 后 将 寄存 器 Ai 的 内 容 从 堆栈 中 弹出 并 放 回 到 


Ai 中 


上 的 工作 空间 。 因 此 ， 每 个 子 程序 的 开始 都 是 指令 


(假定 栈 顶 位 于 第 一 级 以 下 ) 


调用 程序 


MOVE.L 
MOVE.L 
` BSR 
MOVE.L 
ADDI.L 


LINK A6, #0 


` #NUMI, - (A7) 


N,- (A7) 
LISTADD 
4(A7), SUM 
#8,A7 ` 


D0- D1/A2, - (A7) 
16(A7),D1 

#1,D1 

20(A7),A2 

D0 


(A2)+,D0 
D1,LOOP 
D0,20XA7) 
(A7)+,D0 -DLA2 


将 参数 压 入 堆栈 


保存 结果 
恢复 栈 顶 


保存 寄存 器 D0, D1 和 A2 


计数 器 初始 化 为 n 


使 用 DBRA 来 调整 ， 计 数 


初始 化 列表 指针 
将 SUM 初 始 化 成 0 
把 列表 中 的 表 项 相 加 


将 结果 放 入 堆栈 
恢复 寄存 器 





a) 调用 程序 和 子 程序 


Level 2 -~ 





图 3-29 将 图 3-26 中 的 程序 编写 成 一 个 68000 子 程序 ， 通 过 堆栈 传递 参数 


定义 寄存 器 A6 作 为 堆栈 结构 指针 ， 将 A7 指 向 A6 中 原来 保存 内 容 的 位 置 。 这 条 指令 与 图 2-28 中 子 
程序 开始 处 的 两 个 传送 指令 执行 的 操作 相同 。 在 每 一 种 情况 下 , 它 都 是 跟 在 MOVEM 指 令 的 后 面 ， 


b) 不 同时 刻 的 堆栈 内 容 


将 子 程序 中 所 需 寄存 器 的 内 容 保存 到 堆栈 中 。 
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在 图 3-30 的 例子 中 ， 我 们 假定 子 程序 只 使 用 寄存 器 就 可 以 执行 它们 的 任务 ， 所 以 不 需要 堆栈 
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图 3-30 中 程序 的 其 余部 分 都 是 采用 68000 指 令 按 照 图 2-28 中 的 程序 直接 实现 的 。 在 图 3-30 中 的 
程序 执行 时 ， 执 行 的 结果 项 数 保存 到 堆栈 上 ， 如 图 3-31 所 示 。 主 程序 将 两 个 参数 压 人 堆栈 中 ， 之 
后 ，BSR 指 令 将 返回 地 址 2014 压 人 到 堆栈 中 。 注意 由 于 到 SUB1 的 偏 移 量 很 小 ,可 以 用 8 位 来 表示 ， 
所 以 BSR 指 令 可 以 放 在 2012 的 一 个 字 中 。SUB1 中 的 LINK 和 MOVEM 指 令 保存 结构 指针 A6 和 四 个 


其 他 寄存 器 的 内 容 。 


MOVE.L 
MOVE.L 
BSR 
MOVE.L 
ADDLL 


下 一 指令 


第 一 个 子 程序 


2100 SUBI 
2104 


LINK 
MOVEM.L 
MOVEA.L 
MOVE.L 


MOVE.L 
BSR 
MOVE.L 


MOVE.L 
MOVEM.L 
UNLK 
RTS 


第 二 个 子 程序 


3000 SUB2 LINK 
MOVEM.L 


MOVE.L 


MOVE.L 
MOVEM.L 
UNLK 
RTS 


PARAMI, - (A7) 
PARAMI, - (A7) 
SUBI 
(A7),RESUL T 
#8,A7 


A6,#0 

D0- D2/A0, -{A7) 
S(A6).A0 
12(A6),DO 


PARAM3, - (A7) 
SUB2 
(A7)+,D1 


D2,8(A6) 
(A7)+,D0 —- D2/A0 
A6 


A6,#0 
D0- D1,- (A7) 
S(A6),D0 


D1.8(AO) 
(A7)+,D0 -DI 
A6 


将 参数 放 到 堆栈 上 


保存 结果 
恢复 堆栈 级 别 


设置 结构 指针 
保存 寄存 器 
载 人 参数 


将 一 个 参数 放 到 堆栈 上 
从 SUB2 中 弹出 结果 放 到 D1 中 


将 结果 放 到 堆栈 上 
恢复 寄存 器 

恢复 结构 指针 
返回 


设置 结构 指针 
保存 寄存 器 
载 入 参数 


将 结果 放 到 堆栈 中 
恢复 寄存 器 

恢复 结构 指针 
返回 





图 3-30 ”用 68000 汇 编 语 言 编写 的 修 套 子 程序 


在 子 程序 SUB1 调 用 SUB2 之 前 ， 它 将 一 个 参数 param3 压 入 到 堆栈 中 ， 返 回 地 址 2164 由 BSR 指 
令 压 人 到 栈 中 。 由 于 到 目标 地 址 的 偏 移 量 超过 了 8 位 所 能 表示 的 范围 ， 所 以 ，BSR 指 令 占用 了 两 
个 字 。 当 每 个 子 程序 完成 自己 的 任务 时 ， 就 恢复 保存 的 寄存 器 内 容 并 返回 。 在 控制 返回 到 主 程 
序 以 后 ， 由 SUB1 (覆盖 param1) 放 到 堆栈 中 的 结果 将 保存 到 内 存 中 的 RESULT 处 。 之 后 ， 通 过 


ADDPLIL 指 令 ， 堆 栈 指针 A7 将 恢复 它 的 原来 值 并 指向 图 3-31 中 的 原 栈 顶 元 素 。 
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[Dik Á SUBI x 
[A6] 来 自 SUBI1 X 









A6 — 第 二 个 子 程序 的 堆栈 结构 
| DOKAEEF | 
[D1] 来 自主 程序 | 
| [A0] 来 自主 程序 < 
[A6] 来 自主 程序 | 









第 一 个 子 程序 的 堆栈 结构 


A6 — į 


图 3-31 图 3-30 的 68000 堆 栈 结构 


3.14 逻辑 指令 


在 上 节 中 ， 我 们 讨论 了 操作 数 传送 指令 以 及 加 法 和 减法 算术 操作 指令 。 这 些 指 令 中 的 操作 
数 都 具有 32、16 或 8 位 的 固定 长 度 。 在 有 些 应 用 中 需要 处 理 其 他 长 度 的 数据 ， 也 许 是 个 别 的 位 ， 
对 这 些 数 据 执行 逻辑 操作 。68000 中 有 用 于 此 目标 的 几 条 指令 。 特 别 在 68000 中 有 可 以 执行 逻辑 
与 、 或、 异 或 操作 的 指令 ,以 及 具有 几 种 不 同方 式 的 移 位 和 循环 移 位 操作 的 指令 。 

为 了 说 明 逻 辑 指令 的 用 法 ， 我 们 来 看 两 个 例子 。 假 定 寄存 器 DI 中 保存 一 些 32 位 的 模式 ， 我 
们 想 要 判断 该 值 中 的 bis 到 bu 位 是 否 是 11001。 可 以 采用 指令 

AND.L #$7C000,D1 
CMPLL #$64000, D1 
BEQ YES 
第 一 条 指令 是 对 原 操作 数 和 目标 棵 作 数 个 别 位 进行 逻辑 与 的 操作 ， 并 将 结果 保存 到 寄存 器 D1 中 。 
十 六 进 制 数 7C000 的 bws 到 bu 位 是 1， 其 他 的 位 是 9。 这样 与 操作 的 结果 是 寄存 器 D1 中 bis 到 bi 的 五 位 
保持 原 值 不 变 ， 其 余 的 位 全 变 成 0。 后 面 的 比较 指令 是 用 来 检测 这 五 位 是 否 与 所 期 望 模式 对 应 的 。 
数字 打包 程序 

作为 第 二 个 例子 ， 再 次 考虑 图 2-31 中 的 BCD 数 字 打 包 程 序 。 该 程序 的 68000 代 码 如 图 3-32 所 
示 。 在 寄存 器 DO 和 Di 中 分 别 装 有 两 个 ASCII 码 字 节 。LSL 指 令 将 DO 中 的 字 节 左 移 四 位 ， 低 位 部 
分 用 0 填充 。 在 该 指令 操作 数字 段 中 的 第 一 项 是 操作 数 要 传送 的 位 数 。 表 C-4 给 出 的 数 也 可 以 在 
其 他 的 数据 寄存 器 中 指定 。 因 此 ， 如 果 D2 中 的 内 容 已 经 预先 设置 成 4 的 话 ， 下 面 的 指令 也 可 以 达 
到 同样 的 效果 

LSL.B D2, DO 


ANDI 指 令 将 第 二 个 字 节 的 高 四 位 设置 成 0。 最 后 ， 所 期 望 的 4 位 BCD 码 用 “或 ”指令 合并 到 D1 中 ， 
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并 保存 到 内 存 的 PACKED 中 。 


#LOC,A0 A0 指 向 数据 
(A0)+,D0 将 第 一 个 字 节 载 人 DO 


左 移 4 位 

将 第 二 个 字 节 载 人 D1 

将 高 4 位 清 0 

将 两 个 数 连接 
D1,PACKED 保存 结果 





图 3-32 打包 BCD 数 的 68000 远 辑 指 令 的 使 用 


3.15 实例 程序 
在 本 节 中 ， 我 们 给 出 在 第 2 章 中 描述 的 点 积 、 字 节 排 序 和 链表 操作 的 68000 版 本 的 程序 。 
3.15.1 向 量 点 积 程序 


图 2-33 给 出 的 是 计算 两 个 向 量 AVEC 和 BVEC 的 点 积 程序 。 它 的 68000 版 本 如 图 3-33 所 示 。 两 
个 程序 中 除了 控制 循环 的 DBRA 指 令 不 同 以 外 ， 其 余 的 基本 相同 。 为 了 使 计数 器 DO 的 内 容 减 1， 
所 以 必须 使 用 这 条 指令 。 这 正如 在 3.11.2 节 中 描述 的 那样 。 

注意 MULS 指 令 将 两 个 带 符号 的 16 位 数 相 乘 ， 产 生 一 个 32 位 的 乘积 。 我 们 假定 向 量 元 素 用 16 
位 的 字 表 示 ， 点 积 也 是 16 位 的 。 所 有 地 址 都 按照 32 位 来 处 理 。 





MOVEAL #AVEC,Al 第 一 个 向 量 地 址 
MOVEAL #BVEC,A2 第 二 个 向 量 地 址 
MOVE 元 素 个 数 
SUBQ 调整 计数 为 DBRA 
将 D1 用 作 黑 加 器 
从 向 量 A 中 提取 元 素 
与 向 量 B 中 元 素 相 乘 
将 葬 积 累加 
D1,DOTPROD 
152 图 3-33 计算 两 个 向 量 点 积 的 68000 程 序 
3.15.2 字 节 排序 程序 


现在 我 们 考虑 图 2-34 中 给 出 的 字 节 排序 的 程序 。 读 程序 采用 直接 选择 算法 将 表 中 的 字母 按照 
字母 顺序 进行 排序 。 列 表 在 内 存 的 LIST 到 LIST + n -1 中 进行 排序 ， 每 个 字符 用 ASCH 码 表示 ， 占 
一 个 字 节 。n 值 是 一 个 16 位 数 ， 保 存在 地 址 N 处 。 

用 C 语 言 重 写 该 任务 的 程序 如 图 3-34a 所 示 ， 它 在 68000 上 的 实现 由 图 3-34b 中 给 出 。 访 程序 与 
图 2-34b 中 的 程序 非常 相似 ， 只 有 如 下 一 些 细微 的 不 同 。 

68000 中 的 MOVE 指 令 允 许 原 操作 数 和 目标 操作 数 都 可 以 在 内 存 中 。 因 此 ， 当 两 项 进行 交换 
FF, LIST (4) 中 的 值 直接 复制 到 LIST (7 ) 中 。 这 就 省 去 了 在 图 2-34 中 的 临时 寄存 器 R4 的 使 用 ， 使 
得 程序 指令 有 一 些 少量 的 调整 。 
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for (j= n-1;;> O0;j= j— 1) 
[for(k= j-1;k>=0;k=k-1) 
{if (LIST[k] > LIST[; D 
{ TEMP = LIST[k]; 
LIST[k] = LIST[/]; 
LIST[;j] = TEMP; 


MOVEAL #LIST.AI1 表 的 开始 处 的 指针 


N,D1 初始 化 外 部 循环 变 
#1,D1 址 j 到 D1 中 

D1,D2 初始 化 外 部 循环 变 
#1,D2 址 上 型 D2 中 
(Al.D1).D3 当前 最 大 值 在 D3 中 
D3,(A1,D2) 如 果 LIST(k) < [D3], 
NEXT 不 交换 
(A1,D2),(A1,D1) 交换 LIST(O 和 LIST 
D3,(A1,D2) (站 ) 并 将 新 的 最 大 值 载 
(A1,D1),D3 入 D3 中 

D2,INNER 计数 器 Kk 和 j 减 1， 如 
#1,D1 果 没 结束 ， 转 移 返 回 
OUTER 





b) 用 68000 实 现 的 程序 
图 3-34 68000 字 节 排序 程序 


另 一 个 不 同 就 是 在 变 址 4 变化 到 0 的 时 候 使 用 DBRA 指 令 终止 内 部 循环 。 注 意 ， 由 于 j 的 最 终 
值 是 ! 而 不 是 0， 所 以 在 外 部 循环 中 不 能 使 用 DBRA 指 令 。 


3.15.3 链表 的 插入 和 删除 子 程序 


图 3-35 给 出 了 在 链表 中 插入 操作 的 68000 子 程序 ， 该 程序 与 图 2-37 中 的 程序 完全 相同 。 注 意 
比较 指令 CMPA 是 用 来 比较 地 址 值 的 ，CMP 是 用 来 比较 数据 值 的 。 

从 链表 中 删除 一 条 记录 的 68000 程 序 如 图 3-36 所 示 。 该 程序 直接 与 图 2-38 中 的 程序 相对 应 。 

与 图 2-37 和 图 2-38 中 的 普通 子 程序 一 样 ， 图 3-35 中 的 插入 子 程序 假定 新 记录 的 ID 值 与 链表 中 
现 有 的 记录 不 相同 ， 图 3-36 中 的 删除 子 程序 假定 在 链表 中 存在 一 个 ID 值 与 RIDNUM 相 同 的 记录 。 
习题 中 的 3.49 和 3.50 考 虑 的 是 当 假 设 条 件 不 成 立时 如 何 修改 子 程序 产生 报错 信息 。 


WI IA-32 Pentium 实例 


Intel 公 司 在 它 的 处 理 器 产品 系列 中 使 用 了 Intel 体 系 结构 (IA) 这 个 通用 的 名 称 。 我 们 将 描述 
具有 32 位 内 存 地 址 和 32 位 数据 操作 数 的 IA 处 理 器 ,也 就 是 指 IA-32 处 理 器 , 最 新 的 是 Pentium 系 列 。 
第 一 款 IA-32 处 理 器 是 1985 年 面世 的 80386。 其 后 ，80486 (1989). Pentium (1993). Pentium Pro 
(1995). Pentium II (1997), Pentium IH (1999) 和 Pentium 4 (2000) 相继 问世 。 这 些 处 理 器 是 
通过 改进 许多 体系 结构 和 微 电 子 技术 ， 逐渐 提升 它们 的 性 能 级 别 。IA 系 列 的 发 展 过 程 我 们 将 在 
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第 11 章 中 介绍 。 该 系列 中 的 最 新 成 员 具 有 专门 用 来 处 理 多 媒体 图 像 信 息 和 向 量 数据 的 指令 。 这 
些 指令 集 的 特征 在 这 里 只 做 简单 的 描述 ， 在 第 11 章 中 还 有 这 些 方 面 的 阐述 。IA-32 指 令 集 是 非常 
庞大 的 。 关 于 IA-32 指 令 集体 系 结 构 和 汇编 语言 的 详细 信息 可 以 在 Intel 网 站 以 及 Breyt91、 


Dandamudit'9 和 Tabak 中 的 书 中 找到 。 


子 程序 


INSERTION - #0,A0 
HEAD 
A1,A0 


(A0)(A1) 
SEARCH 
A0,A1) 
A1,A0 


A0,A2 
4(A2),A3 
#0,A3 
TAIL 
(A3),(A1) 
INSERT 
A3,A2 
LOOP 
A2,4(A1) 
A1.4(A2) 


(A0),D1 
SEARCH 
4(A0).AO 


4(A3).D2 
D2,4(A2) 





A0 是 RHEAD 

Al 是 RNEWREC 

新 记录 的 ID 与 表 头 比较 
新 记录 成 为 新 表 头 


A2 是 RCURRENT 
A3 是 RNEXT 


移 向 下 一 记录 


Di 是 RIDNUM 
删除 头 记录 


A2 是 RCURRENT 
A3 是 RNEXT 


D2 是 RTEMP 


图 3-36 从 链表 中 删除 一 条 记录 的 68000 子 程序 


3.16 寄存 器 和 寻 址 方式 


在 IA-32 体 系 结构 中 ， 内 存 采用 字 节 可 寻 址 的 32 位 地 址 ， 指 令 的 操作 数 是 8 位 或 32 位 的 。 这 些 
指令 在 Intel 术 语 中 称 为 “ 字 节 ”和 “ 双 字 ”。16 位 的 操作 数 在 早期 的 16 位 Intel 处 理 器 中 称 为 “ 字 ”。 
这 里 使 用 的 是 在 2.2.2 节 中 描述 的 litie-endian 寻 址 方式 。 多 字 节 数据 的 操作 数 可 以 在 任意 的 字 节 地 
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址 处 开始 ， 没 有 必要 必须 限制 在 内 存 的 特定 地 址 边界 上 对 齐 。 
3.16.1 IA-32 寄 存 器 结构 


图 3-37 中 所 示 的 是 处 理 器 寄存 器 。 虽 然 有 一 些 例 外 ，8 个 32 位 标 有 R0 到 R7 的 寄存 器 是 通用 寄 
存 器 ， 可 以 用 来 保存 数据 操作 数 或 寻 直 信息 。 有 8 个 浮 点 寄存 器 用 来 存储 双 字 或 四 字 (64 位 ) 的 
浮 点 操作 数 。 浮 点 寄存 器 中 还 有 一 个 总 长 度 是 80 位 的 扩展 字段 ， 在 图 3-37 中 没有 给 出 。 第 6 章 中 
对 浮 点 数 的 表示 和 操作 进行 了 讨论 。 这 个 主题 在 第 3 章 中 不 再 讨论 。 

IA-32 体 系 结构 是 以 具有 不 同 用 途 的 被 标 为 段 的 不 同 内 存 区 域 为 基础 的 。 代 码 段 保存 程序 的 
指令 。 堆 栈 段 存放 处 理 器 堆 校 ， 四 个 数据 段 是 用 来 保存 数据 操作 数 的 。 图 3-37 中 的 6 个 段 寄 存 器 
保存 着 用 于 在 内 存 空间 中 确定 这 些 段 位 置 的 选择 器 值 。 这 些 寄存 器 的 具体 功能 将 在 第 11 章 的 IA 
系列 讨论 中 进行 前 述 。 这 里 ， 我 们 不 必 知 道 细节 。IA-32 体 系 结构 中 的 32 位 地 址 假定 是 可 以 在 程 
序 中 访问 存储 器 的 任何 一 个 单元 、 处 理 器 堆栈 或 数据 堆 区 。 

图 3-37 底 部 给 出 的 两 个 寄存 器 是 指令 指针 ， 它 们 作为 程序 计数 器 保存 下 一 条 将 要 执行 的 指令 














| 通用 
| | 寄存 器 
mw 
63 0 
rof 一 — 一 
ete manamana naana awr eve — I 
FPI L E 
| I | 8 个 
| | 寄存 器 
FP7 ü II | 





31 SSS ua. 0 

[ | 指令 指针 

31 13 12 11 987 6 0 

状态 寄存 器 

IOPL- 输 入 
权限 级 别 Aat CF 一 进位 
OF 一 溢出 inr F 
IF 一 中 断 允许 TF 一 陷阱 


图 3-37 IA-32 寄 存 器 结构 
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地 址 和 保存 条 件 码 标志 (CF, ZF, SF. OF) 的 状态 寄存 器 。 这 些 标志 中 包含 有 关 算 术 操 作 的 结 
果 信息 ， 就 像 在 3.19 节 中 讨论 的 一 样 。 程 序 执行 模式 位 (IOPL. IF. TF) 与 第 4 章 讨论 的 输入 / 输 
出 操作 和 中 断 的 内 容 相关 。 

IA-32 通 用 寄存 器 保持 了 与 8 位 和 16 位 处 理 器 寄存 器 的 兼容 性 。 在 那些 处 理 器 中 ， 程 序 中 对 不 
同 处 理 器 的 具体 用 法 有 一 些 应 用 上 的 限制 。 图 3-38 给 出 了 IA-32 寄 存 器 与 早期 处 理 器 寄存 器 之 间 
的 结合 。8 个 通用 寄存 器 分 成 三 种 不 同 的 类 型 : 数据 寄存 器 用 来 保存 操作 数 ， 指 针 和 变 址 寄存 器 
用 来 存储 地 址 和 用 来 确定 内 存 操作 数 有 效 地 址 的 变 址 地 址 。 


通用 寄存 器 
名 称 31 1615 87 


6 0 
Vi li ili i 


指针 


寄存 器 


变 址 

E oi 罕有 
=m mei 
emas [ | mas | nerta 


图 3-38 IA-32 与 早期 的 mtel 处 理 器 寄存 器 结构 的 兼容 性 


在 Intel 最 初 的 8 位 处 理 器 中 ， 数 据 寄存 器 称 为 A、B、C 和 D。 在 随后 的 16 位 处 理 器 中 它们 被 
标志 为 AX、BX、CX 和 DX。 每 个 寄存 器 中 的 高 位 字 节 和 低位 字 节 分 别 用 H 和 EL 来 标识 。 例 如 ， 
在 寄存 器 AX 中 的 两 个 字 节 是 AH 和 AL。IA-32 处 理 器 中 ， 前 组 E 用 来 表示 相应 “扩展 的 ”32 位 寄 
存 器 : EAX、EBX、ECX 和 EDX。E 前 级 标志 还 可 以 用 于 其 他 的 32 位 寄存 器 ， 如 图 3-38 中 所 示 。 
它们 是 早期 处 理 器 的 16 位 寄存 器 的 相应 版 本 。 
这 种 寄存 器 标志 在 Intel 技 术 文档 和 其 他 Intel 处 理 器 描述 中 使 用 。 由 于 保持 历史 标志 的 原因 ， 
157] “Intel 在 它 的 处 理 器 系列 中 必须 保持 着 向 上 兼容 的 特点 。 也 就 是 说 为 早期 的 16 位 处 理 器 编写 的 机 器 
语言 程序 ， 只 要 是 IA-32 处 理 器 的 状态 设置 正确 ， 就 可 以 无 需 修改 在 IA-32 处 理 器 上 正确 运行 。 我 
们 将 在 给 定 的 汇编 语言 程序 例子 中 ， 使 用 E 前 级 寄存 器 标志 ， 因 为 IA-32 处 理 器 的 汇编 语言 的 当 
前 版 本 中 使 用 的 就 是 这 些 助 记 符 。 当 字 节 操作 数 在 相应 的 32 位 寄存 器 中 的 低 八 位 时 ， 将 使 用 AL、 
BL 等 标志 。 
在 程序 执行 由 使 用 指令 前 缀 字 节 指定 的 指令 期 间 ，IA-32 处 理 器 状态 可 以 在 32 位 和 16 位 操作 
之 间 进 行动 态 切 换 。 这 一 特点 我 们 将 在 第 11 章 中 讨论 。 
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3.16.2 IA-32 寻 址 方式 


IA-32 体 系 结构 有 一 套 大 而 灵活 的 寻 址 方式 。 它 们 既 可 以 访问 个 别 数 据 项 ， 也 可 以 访问 从 指 
定 内 存 地 址 开始 的 有 序 表 数据 项 。 我 们 给 出 这 些 方式 的 完整 定义 以 及 在 汇编 语言 中 的 表达 方式 。 

在 2.5 节 中 已 描述 过 ， 大 多 数 处 理 器 中 都 有 基 址 方式 。 它 们 是 : 立即 方式 、 绝 对 方式 、 寄 存 
器 方式 和 寄存 器 间接 方式 。Intel 对 绝对 方式 使 用 了 直接 来 描述 ， 所 以 在 这 里 我 们 还 采用 同样 的 方 
式 。 还 有 几 种 用 来 访问 内 存 数据 操作 数 的 更 加 灵活 的 寻 址 方式 。 在 2.5 节 中 描述 的 最 灵活 的 方式 
就 是 具有 通用 符号 X (Ri, Rj ) 的 变 址 方式 。 操 作 数 的 有 效 地 址 EA 计算 如 下 

EA = [Ri] + [Rj] +X 

其 中 Ri 和 Rj 是 通用 寄存 器 ，X 是 一 个 常量 。 寄 存 器 Ri 和 Ry 分 别称 为 基 址 和 变 址 寄存 器 ， 常 量 X 叫 
做 位 移 重 。IA-32 寻 址 方式 中 包括 这 种 方式 和 该 类 型 的 更 简单 变化 形式 。 

整个 IA-32 寻 址 方式 定义 如 下 : 

立即 方式 一 一 操作 数 包含 在 指令 中 。 它 是 一 个 8 位 或 32 位 的 数 ， 其 长 度 用 指令 的 操作 码 中 的 
一 位 来 指定 。 该 位 是 0 表示 短 版 本 ，1 表 示 长 版 本 。 

直接 方式 一 一 操作 数 的 内 存 地 址 是 通过 指令 中 的 一 个 32 位 值 给 出 。 

寄存 器 方式 一 一 操作 数 包 含 在 指令 中 的 一 个 通用 寄存 器 中 。 

寄存 器 间接 方式 一 一 操作 数 的 内 存 地址 包含 在 指令 中 的 一 个 通用 寄存 器 中 。 

带 有 位 移 量 的 基 址 方式 一 一 在 指令 中 给 出 了 一 个 8 位 或 32 位 的 带 符号 的 位 移 量 以 及 一 个 用 作 
基 址 寄存 器 的 通用 寄存 器 。 操 作 数 的 有 效 地 址 是 基 址 寄存 器 和 位 移 量 的 和 。 

带 有 位 移 量 的 变 址 方式 一 在 指令 中 给 出 一 个 32 位 的 带 符号 的 位 移 量 ， 一 个 用 作 变 址 寄存 器 
的 通用 寄存 器 和 一 个 1、2、4 或 8 的 比例 因子 。 操 作 数 的 有 效 地 址 是 变 址 寄存 器 的 内 容 乘 以 比例 
因子 之 后 再 与 位 移 量 相 加 的 和 。 

带 有 变 址 的 基 址 方式 一 一 在 指令 中 给 出 两 个 通用 寄存 器 和 一 个 1、2、4 或 8 的 比例 因子 。 寄 存 
器 用 作 基 址 和 变 址 寄存 器 ， 操 作 数 的 有 效 地 址 按 如 下 方式 计算 : 变 址 寄存 器 的 内 容 与 比例 因子 
相 乘 ， 之 后 再 与 基 址 寄存 器 中 的 内 容 相 加 。 

带 有 变 址 和 位 移 重 的 基 址 方式 一 一 在 指令 中 给 出 一 个 8 位 或 32 位 的 带 符号 的 位 移 量 ， 两 个 通 
用 寄存 器 和 一 个 1、2、4 或 8 的 比例 因子 。 寄 存 器 用 作 基 址 和 变 址 寄存 器 ， 操 作 数 的 有 效 地 址 按照 
如 下 方式 计算 : 变 址 寄存 器 中 的 内 容 乘 以 比例 因子 ， 结 果 再 与 基 址 寄存 器 的 内 容 及 位 移 量 相 加 。 

IA-32 寻 址 方式 与 汇编 语言 表达 方式 在 表 3-3 中 给 出 。 在 表 中 还 给 出 了 操作 数 有 效 地 址 的 计算 。 
正如 中 表 3-3 的 脚注 中 说 明 的 那样 ， 寄 存 器 ESP 不 能 用 作 变 址 寄存 器 ， 它 是 作为 处 理 器 堆栈 指针 
的 。 现 在 ， 我 们 给 出 几 个 例子 来 说 明 如 何 使 用 寻 址 方式 来 访问 操作 数 。 

在 双 操 作 数 的 指令 中 ， 源 操作 数 (src) 和 目标 操作 数 (dst) 使 用 下 面 的 汇编 语言 来 指定 : 

OPcode dst, src 


这 个 顺序 与 本 章 部 分 I 的 ARM 体 系 结构 是 相同 的 ， 但 却 和 第 2 章 及 本 章 部 分 I Motorola 68000 处 理 
器 中 的 用 法 相反 。 例 如 ， 指 令 








MOV dst, src 
执行 的 操作 
dst- [ sre } 
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表 3-3 ”|A-32 寻 址 方式 





名 R 汇编 语法 寻 址 功能 
立即 方式 Value Operand = Value 
直接 方式 Location EA = Location 
寄存 器 方式 Reg EA = Reg 

即 Operand = [Reg] 

寄存 器 间接 方式 [Reg] EA = [Reg] 
带 有 位 移 量 的 基 址 方式 [Reg + Disp] EA = [Reg] + Disp 
带 有 位 移 量 的 变 址 方式 [Reg*s + Disp] EA = [Reg] x S + Disp 
带 有 变 址 的 基 址 方式 [Reg! + Reg2*S] EA = [Reg1] + [Reg2] x 5 
带 有 变 址 和 位 移 量 的 基 址 方式 [Regl + Reg2=S + Disp] EA = [Regi] + [Reg2] x S + Disp 


Value = 8 位 或 32 住 带 符号 数 
Location = 32 位 地 址 
Reg, Regl, Reg2 = 通用 寄存 器 EAX, EBX, ECX, EDX, ESP, EBP, ESI. EDIP H—A, Jp HESPR IE M 4E 
址 寄存 器 
Disp = 8 位 或 32 位 带 符 号 数 ， 除 了 在 带 有 位 移 量 的 变 址 方式 中 只 能 使 用 32 位 
S= 比例 因子 1、2、4 或 8 
使 用 Move 指 令 来 说 明 IA-32 寻 址 方式 是 非常 方便 的 。 指 令 
MOV EAX, 25 
使 用 立即 寻 址 方式 将 十 进 制 数值 25 传 送 到 EAX 寄存 器 中 。 用 0 到 9 这 种 数字 形式 指明 数值 是 十 进 
制 计 数 方式 。 后 级 B 和 分别 用 来 表示 二 进 制 和 十 六 进 制 数 。 例 如 ， 指 令 
MOV EAX, 3FA00H 
将 十 六 进 制 数 3FA00 传 送 到 EAX 中 。 ! 
指令 
MOV EAX, LOCATION 
使 用 直接 寻 址 方式 将 内 存 中 地 址 标志 LOCATION 处 的 双 字 传 送 到 寄存 器 EAX 中 。 这 里 是 假定 在 
汇编 语言 程序 的 数据 声明 部 分 中 已 经 定义 了 这 个 内 存 地 址 标志 。 我 们 将 在 3.18 节 中 了 解 这 是 如 何 
实现 的 。 如 果 LOCAHION 代 表 的 地 址 是 1000， 那 么 这 条 指令 将 1000 处 的 双 字 传 送 到 EAX 中 。 
在 IA-32 汇 编 语言 程序 中 对 立即 寻 址 方式 和 直接 寻 址 方式 之 间 的 区 别 作 了 一 些 讨 论 ， 因 为 有 
时 会 产生 一 些 混淆 。 考 虑 下 面 的 情况 ， TMAA PE a ETARE AOR EA ERES AEE 
便 的 。 汇 编 指 示 
NUMBER EQU 25 
将 十 进 制 数 25 与 一 个 符号 名 NUMBER 关 联 起 来 ， 正 如 在 2.6.1 节 中 讨论 的 一 样 。 如 果 这 样 做 ， 那 
么 指令 
MOV EAX, NUMBER 
将 被 汇编 程序 解释 成 NUMBER 是 一 个 立即 操作 数 ， 要 被 传送 到 寄存 器 EAX 中 。 相 反 ， 如 果 
NUMBER 定 义 成 一 个 地 址 标志 ， 这 个 指令 将 按照 直接 寻 址 方式 来 解释 。 
在 很 多 汇编 语言 中 ， 这 种 潜在 的 混淆 状态 用 一 个 特殊 的 符号 来 避免 ， 例 如 ，# 作 为 前 缀 来 说 
明 是 立即 寻 址 方式 。 在 IA-32 汇 编 语言 中 ， 使 用 方 括号 明确 地 指明 直接 寻 址 方式 ， 如 指令 
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MOV EAX, [LOCATION] 


然而 ， 如 果 LOCATION 已 经 定义 成 一 个 地 址 标志 时 ， 就 不 必 使 用 方 括号 了 。 
当 有 必要 将 一 个 地 址 标志 处 理 成 一 个 立即 操作 数 时 ， 使 用 汇编 指示 OFFSET。 例 如 ， 指 令 
MOV EBX, OFFSET LOCATION 


采用 立即 寻 址 方式 ， 将 地 址 标志 LOCATION (例如 是 1000) 处 的 值 传送 到 EBX 寄 存 器 中 。 然 后 ， 
EBX 寄 存 器 可 以 当 作 寄 存 器 间接 方式 在 指令 


MOV EAX, [EBX] 


中 将 内 存 地 址 LOCATION 处 的 内 容 (包含 在 寄存 器 EBX 中 ) 传送 到 寄存 器 EAX 中 。OFFSET 是 一 
个 汇编 指示 ， 它 用 来 表示 一 个 地 址 ， 读 地 址 总 是 保存 着 从 内 存 段 的 起 始 位 置 到 包含 该 地 址 之 间 
的 一 个 相对 距离 。 在 所 有 这 些 例 子 中 ， 寄 存 器 方式 常常 用 来 说 明 目 标 。 

这 些 例子 已 经 说 明了 基本 的 寻 址 方式 : 立即 、 直 接 、 寄 存 器 和 寄存 器 间接 方式 。 其 余 的 四 
种 寻 址 方式 在 访问 内 存 操作 数 时 提供 了 更 加 灵活 的 方式 。 

带 有 位 移 量 的 基 址 方式 在 图 3-39a 中 作 了 说 明 。 寄 存 器 EBP 用 作 基 址 寄存 器 。 双 字 操 作 数 与 
基 址 寄存 器 1000 相 距 60 个 字 节 ， 也 就 是 在 地 址 1060 处 可 以 使 用 指令 

MOV EAX, [EBP + 60] 
传送 到 寄存 器 EAX 中 。 

IA-32 指 令 和 寻 址 方式 可 以 对 字 节 操作 数 和 双 字 操 作 数 进行 处 理 。 例 如 ， 还 是 假定 基 址 寄存 
器 EBP 中 的 地 址 是 1000， 在 地 址 1010 处 的 字 节 操作 数 可 以 使 用 下 面 的 指令 

MOV AL, [EBP + 10] 
装 人 到 EAX 寄存 器 中 的 低 字 节 部 分 中 。 由 于 目标 操作 数 AL 是 EAX 寄存 器 的 低 字 节 部 分 ， 所 以 汇 
编程 序 选 择 用 作 字 节 数 据 的 Move 操 作 码 版 本 。 

最 灵活 的 寻 址 方式 就 是 带 有 变 址 和 位 移 量 的 基 址 方式 。 图 3-39b 中 给 出 了 一 个 例子 ， 其 中 用 
EBP 和 ESI 作 为 基 址 和 变 址 寄存 器 。 这 个 例子 给 出 的 是 如 何 使 用 这 种 方式 在 一 个 双 倍 字 长 的 操作 
数 表 中 访问 一 个 双 倍 字 长 的 操作 数 。 该 表 是 在 与 基地 址 1000 距 离 200 处 开始 。 对 变 址 寄存 器 中 的 
内 容 使 用 比例 因子 4， 可 以 使 用 变 址 寄存 器 中 连续 的 变 址 0, 1, 2,… 来 访问 在 地 址 1200, 1204, 1208… 
处 的 连续 双 倍 字 操作 数 。 图 中 的 例子 表示 ， 当 变 址 寄存 器 中 的 值 是 40 时 ， 就 是 要 访问 地 址 1360 
处 的 双 倍 字 (也 就 是 1000 + 200 +4 x 40)。 这 个 操作 数 通过 指令 

MOV EAX, [EBP + ESI * 4 + 200] 


装 人 到 寄存 器 EAX 中 。 在 这 个 寻 址 方式 中 使 用 比例 因子 4， 可 以 使 在 一 个 循环 程序 中 访问 表 中 连 
续 的 双 倍 字 操 作 数 更 加 容易 ， 只 需 在 每 遍 循 环 中 对 变 址 寄存 器 加 1。 在 对 这 两 种 方式 作 了 比较 详 
细 的 讨论 之 后 ， 与 其 紧密 相关 的 带 位 移 量 的 变 址 方式 和 带 变 址 的 基 址 方式 将 会 很 容易 理解 。 

在 结束 寻 址 方式 的 讨论 之 前 ， 表 3-3 中 的 各 项 注释 是 很 有 用 的 。 带 有 位 移 量 的 基 址 方式 看 起 
来 是 多 余 的 ， 由 于 通过 带 有 位 移 量 的 变 址 方式 (比例 因子 是 1)， 就 可 以 实现 同样 的 效果 。 但 是 
由 于 前 一 种 方式 可 以 编码 在 一 个 字 节 之 中 ， 其 还 是 有 用 的 。 此 外 ， 带 有 位 移 量 的 变 址 方式 的 位 
移 量 只 能 是 32 位 的 。 

关于 寻 址 方式 如 何 编码 成 机 器 指令 的 讨论 包含 在 下 一 节 中 。 更 多 细节 参见 附录 D。 
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主 存 

io | 基 址 寄存 器 EBP 
位 移 量 

1060 





操作 数 地 址 (EA) = [EBP] + 60 
a) 带 有 位 移 量 的 基 址 方式 ， 表 示 为 [ EBP+60 ] 





比例 因子 =4 
160 = [ 变 址 寄存 器 ]X 4 


4 字 节 (KE) 
数据 项 列表 





操作 数 地 址 (EA) = [EBP] + [ESI] X 4 + 200 
b) 带 有 位 移 基 和 变 址 的 基 址 方式 ， 表 示 为 [ EBP + ESI*4 + 200 ] 
图 3-39 IA-32 结 构 中 寻 址 方式 举例 


3.17 IA-32 指令 


IA-32 指 令 系统 是 很 庞大 的 。 它 可 以 按照 动态 长 度 指令 格式 进行 编码 ， 而 无 需 使 用 完全 规则 
的 编码 方案 。 我 们 将 在 3.17 节 中 来 了 解 它 的 指令 格式 。 大 多 数 的 IA-32 指 令 都 有 一 个 到 两 个 操作 
数 。 在 双 操 作 数 的 情况 下 ， 只 能 有 一 个 操作 数 在 内 存 中 。 另 一 个 操作 数 必 须 是 在 处 理 器 的 寄存 
器 中 。 除 了 通常 的 内 存 与 处 理 器 寄存 器 之 间 的 数据 传送 指令 以 外 ， 还 有 执行 算术 操作 的 指令 ， 
指令 系统 中 包含 很 多 不 同 的 对 数据 的 逻辑 和 移 位 /循环 移 位 操作 指令 。 字 节 串 指令 用 来 对 非 数值 
数据 进行 处 理 。 在 指令 系统 中 还 直接 支持 对 处 理 器 堆栈 进行 的 压 栈 和 弹出 操作 。 

我 们 将 对 指令 系统 中 的 一 小 部 分 进行 介绍 ， 以 此 说 明 它们 在 一 个 简单 完整 的 程序 中 是 如 何 
使 用 的 。 指 令 

ADD dst, src 

执行 的 操作 是 
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dst — [dst] + [src] 
正如 我 们 在 前 面 看 到 的 那样 ， 
MOV dst, src 
执行 的 操作 
dst — [src] 

假定 两 个 操作 数 在 寄存 器 EAX 和 EBX 中 ， 它 们 的 和 可 以 用 下 面 的 两 条 指令 序列 在 EAX 中 被 计算 
出 来 并 存储 在 内 存单 元 SUM 中 : 

ADD EAX, EBX 

MOV SUM, EAX 
由 于 在 双 操 作 数 指令 中 只 能 有 一 个 操作 数 放 在 内 存 中 ， 操 作 


C<[A]+I[B] 
中 包括 了 三 个 存储 单元 A、B 和 C， 所 以 可 以 用 指令 序列 : 

MOV EAX, A 

ADD EAX, B 

MOV C,EXA 
来 执行 。 减 法 指令 

SUB dst, src 
执行 操作 


dst — [dst] — [src] 
非常 有 用 的 单 操作 数 指令 INC 和 DEC 可 以 对 它们 的 操作 数 进行 加 1 或 减 1。 
在 给 出 一 个 完整 的 数值 相 加 循环 程序 之 前 ， 我 们 还 需要 一 些 指令 。 其 中 之 一 就 是 条 件 转移 
指令 。 转 移 指 令 
JG LOOPSTART 
如 果 最 近 的 算术 操作 结果 大 于 0， 转 移 指令 就 执行 在 内 存 LOOPSTART 处 的 指令 。 所 有 的 条 件 转 


移 指令 都 是 以 字母 J (表示 跳 转 ) 开头 ， 后 面 跟着 的 字符 指定 条 件 。 在 本 例 中 ，G 代 表 大 于 0。 其 
他 的 条 件 转移 将 在 后 面 讨 论 。 

为 了 在 寄存 器 间接 寻 址 中 使 用 通用 寄存 器 ， 首 先 必 须 将 内 存 地 址 装 和 人 到 要 访问 的 寄存 器 中 。 
IA-32 指 令 系统 中 提供 了 两 种 实现 方式 。 如 果 地 址 是 作为 地 址 标志 明确 知道 的 ， 比 如 说 
LOCATION， 它 可 以 在 一 个 传送 指令 中 用 立即 寻 址 方式 将 其 装 到 寄存 器 中 ， 比 如 

MOV EBX, OFFSET LOCATION 
该 指令 将 标志 LOCATION 所 代表 的 地 址 装 入 到 寄存 器 EBX 中 。 另 一 种 方式 是 使 用 一 条 称 为 “ 装 
人 有 效 地 址 ”( 助 记 符 是 LEA) 的 指令 。 指 令 
LEA EBX,[EBP+12] 

将 EBP+12] 处 的 操作 数 地 址 装 到 寄存 器 EBX 中 。 当 指令 执行 时 ， 这 个 地 址 要 依赖 于 寄存 器 EBP 中 
的 内 容 。 

用 于 数值 相 加 的 循环 程序 

采用 刚刚 介绍 过 的 指令 ， 现 在 我 们 可 以 利用 一 个 循环 给 出 数值 相 加 的 程序 。 假 定 在 内 存 以 


p= 





118 #3 # 





NUMI 开 始 处 有 一 个 列表 ， 表 中 的 一 个 32 位 整数 保存 内 存 位 置 N 中 。 汇 编 语言 程序 如 图 3-40a 所 
示 可 以 将 数值 相 加 并 将 它们 相 加 的 和 保存 到 内 存 的 SUM 中 。 

寄存 器 EBX 中 保存 着 地 址 值 NUM1。 在 STARTADD (循环 指令 中 的 第 一 条 指令 ) 单元 指令 中 
的 带 变 址 的 基 址 寻 址 方式 中 ， 它 当 作 基 址 寄存 器 ， 寄 存 器 EDI 当 作 变 址 寄存 器 。 在 进入 循环 之 前 ， 
它 被 清 成 0。 在 第 一 次 循环 中 ，[EBX]=NUM1i 处 的 第 一 个 数 被 加 到 初始 化 成 0 的 EAX 寄存 器 中 。 
之 后 ， 变 址 寄存 器 增加 1。 这 样 ， 在 循环 的 第 二 遍 中 ， 加 法 指令 中 的 比例 因子 4 将 使 得 在 地 址 
NUMI1+4 字 节 处 的 第 二 个 32 位 数 加 到 EAX 中 。 在 后 续 的 循环 中 ， 分 别 将 NUM1+8, NUM1+12, … 
处 的 数 相 加 。 寄 存 器 ECX 用 作 计 数 器 寄存 器 。 该 寄存 器 最 初 是 由 程序 中 的 第 二 条 指令 将 内 存 中 NN 
单元 中 的 内 容 装载 到 其 中 ， 在 程序 中 的 每 遍 循环 中 都 减 1。 





EBX,NUMI 初始 化 基 址 寄存 器 (EBX) mit 
ECX,N 数 寄存 器 (ECX) 
EAX,0 清除 累加 器 (EAX) 和 变 址 寄存 


EDILO 器 (EDI) 
STARTADD: EAX,[EBX + EDI * 4] 将 下 一 个 数 加 到 EAX 
EDI 变 址 寄存 器 增 1 
ECX 计数 寄存 器 减 1 
STARTADD 如 果 [ECX]>0， 转 移 返 回 
SUM,EAX 将 和 保存 到 内 存 中 


a) 直接 方法 





EBX,NUMI 载 入 基 址 寄存 器 EBX 并 调整 保存 
EBX,4 NUMI -4 

ECX,N 初始 化 计数 / 变 址 寄存 器 (ECX) 
EAX,0 清除 累加 器 (EAX) 


STARTADD: EAX,[EBX + ECX * 4] 将 下 一 个 数 加 到 EAX 
STARTADD ECX 减 1， 如 果 [ECX]>0 转 移 返 回 


SUM,EAX 将 和 保存 到 内 存 中 
b) 更 紧凑 的 程序 
图 3-40 数值 相 加 的 IA-32 程 序 


条 件 转移 指令 JG 在 [ ECX ] > 0 时 引起 转移 返回 。 当 ECX 的 内 容 达 到 0 时 ， 全 部 的 数 已 经 相 加 完毕 。 
没有 执行 转移 ， 而 是 用 传送 指令 将 寄存 器 EAX 中 相 加 的 和 保存 到 内 存 中 的 SUM 单 元 中 。 

通过 对 图 3-40a 程 序 中 的 下 面 两 条 指令 的 观察 ， 这 个 任务 可 以 采用 一 个 更 简捷 的 方式 编写 。 
两 条 指令 序列 





DEC ECX 

JG STARTADD 
通常 是 出 现在 程序 循环 的 最 后 部 分 。 因 此 ，IA-32 指 令 系 统 中 包括 一 个 将 这 两 条 指令 的 操作 合并 
成 一 条 指令 的 功能 。 指 令 

LOOP STARTADD 
首先 将 ECX 寄 存 器 减 1， 之 后 如 果 ECX 的 内 容 还 没有 达到 0， 就 转移 到 目标 地 址 STARTADD 处 。 

观察 的 第 二 点 就 是 使 用 了 两 个 寄存 器 EDI 和 ECX 作 为 计数 器 。 如 果 反 向 扫描 所 要 相 加 的 数字 

列表 ， 从 列表 的 最 后 一 个 数 开 始 ， 则 只 需 使 用 一 个 计数 寄存 器 。 由 于 寄存 器 ECX 是 LOOP 指 令 隐 
含 引 用 的 寄存 器 ， 所 以 我 们 使 用 该 寄存 器 。 假 定 [N ] =n， 当 EDI 中 包含 的 序列 值 是 0, 1, 2,…, (n —- D, 
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第 一 个 程序 用 地 址 序列 NUM1, NUMI +4, NUM! + 8, …, NUM1+4 (n — 1) 来 访问 数值 。 当 ECX 中 
的 值 是 n,n 一 1, …, 1 时 ， 新 程序 如 图 3-40b 所 未 ， 使 用 的 地 址 序列 是 NUMI - 4) + 4n, (NUMI — 4) 
+4 @m— 1), (NUMI-4 +4(D。 因 此 ,为 了 解决 EDI 与 ECX 中 的 顺序 不 同 ， 要 将 新 程序 的 基 
址 寄存 器 中 的 值 从 NUM1 改 写成 NUM1 - 4。 在 新 程序 中 的 最 后 一 人 遍 循环 中 执行 循环 指令 之 前 ， 
[ECX] = 1， 最 后 要 相 加 的 数 在 内 存 中 的 NUM1 处 。 

读者 应 该 注意 到 在 处 理 列表 和 数组 中 ， 在 以 0 或 1 开始 的 进行 适当 变 址 计算 中 ， 以 及 在 正确 
选择 转移 条 件 中 ,会 经 常 出 现 这 种 详细 的 推理 类 型 。 它 也 可 能 是 一 些微 妙 错误 的 根源 所 在 。 在 
高 级 语言 中 ， 列 表 变量 明确 引用 LIST (0), LIST (1),…, LIST (n - 1)， 以 及 循环 范围 与 下 面 使 用 的 
表达 式 变 址 值 相关 : 

FOR i FROM 0 UPTO (n-1) 
或 
FOR i FROM (n-1) DOWNTO 0 

这 种 情况 下 困难 相对 来 说 要 小 一 些 。 

这 里 使 用 加 法 循环 程序 的 例子 简要 讨论 了 一 些 常用 的 IA-32 指 令 ， 并 对 使 用 的 指令 系统 的 基 
本 特征 和 汇编 语言 作 了 简要 介绍 。 现 在 ， 我 们 来 描述 指令 的 机 器 表示 格式 。 


机 器 指令 格式 


机 器 指令 的 一 般 格式 如 图 3-41 所 示 。 指 令 是 可 变 长 的 ， 变 化 的 范围 从 一 个 字 节 (只 有 一 个 操 
作 码 ， 通 常情 况 下 都 需要 ) 到 12 个 字 节 ， 由 四 个 字段 构成 。 操 作 码 字段 是 由 一 个 或 两 个 字 节 构 
成 的 ， 大 多 数 指令 只 需要 一 个 字 节 。 紧 跟 在 操作 码 字段 之 后 的 寻 址 方式 信息 保存 在 一 到 两 个 字 
节 中 。 对 于 只 使 用 一 个 寄存 器 来 产生 操作 数 有 效 地 址 的 指令 ， 寻 址 方式 字段 中 只 需要 一 个 字 节 。 
对 于 表 3-3 中 的 最 后 两 个 寻 址 方式 的 编码 是 需要 两 个 字 节 的 。 这 些 方式 使 用 两 个 寄存 器 来 产生 内 
存 操作 数 的 有 效 地 址 。 

在 计算 内 存 操作 数 的 有 效 地 址 中 要 使 用 一 个 位 移 量 ， 那 么 这 个 位 移 量 就 用 一 个 或 四 个 字 节 
进行 编码 ， 并 放 在 紧 跟 在 寻 址 方式 字段 之 后 的 字段 中 。 如 果 操 作 数 之 一 是 立即 数 ， 那 么 它 被 放 
在 指令 的 最 后 一 个 字段 中 ， 占 用 一 个 或 四 个 字 节 。 

对 于 一 些 简单 的 例如 下 面 首先 要 讨论 的 这 些 指 令 ， 指 令 中 包括 的 一 个 寄存 器 的 代码 ， 在 操 
作 码 字 节 中 给 出 。 但 是 ， 对 于 大 多 数 指令 和 寻 址 方式 而 言 ， 使 用 的 寄存 器 是 在 寻 址 方式 字段 中 
指定 的 。 

在 任何 指令 系统 中 ， 指 令 用 可 变 长 格式 进行 编码 ， 那 么 指令 的 位 模式 在 从 左 向 右 读 取 时 ， 
必须 确定 指令 的 总 长 度 。 这 是 因为 程序 中 的 连续 指令 在 内 存 中 是 一 个 接着 一 个 放置 的 ， 没 有 其 
他 的 可 用 信息 来 指示 指令 间 的 边界 ， 所 以 总 长 度 是 很 重要 的 。 


单字 节 指令 
寄存 器 可 以 用 只 占 一 个 字 节 的 指令 进行 增加 或 减 小 。 例 如 
INC EDI 
和 
DEC ECX 


其 中 通用 寄存 器 EDI 和 ECX 是 在 单个 操作 码 字 节 中 用 3 位 码 指定 的 。 
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i 或 2 1 或 2 1 或 4 1 或 4 
字 节 字 节 字 节 zH 
图 3-41 IA-32 指 令 格 式 
立即 方式 编码 
操作 码 说 明 何 时 使 用 立即 寻 址 方式 。 例 如 ， 指 令 


MOV EAX, 820 


被 编码 成 5 个 字 节 。 单 字 节 操作 码 说 明 是 传送 操作 、 使 用 的 是 32 位 的 立即 操作 数 以 及 目标 寄存 器 
的 名 称 。 操 作 码 字 节 后 面 紧 跟着 4 字 节 的 立即 数 的 值 820。 当 使 用 8 位 的 立即 操作 数 时 ， 指 令 如 下 : 
MOV DL, 5 


对 该 指令 编码 仅 需要 两 个 字 节 。 

寻 址 方式 和 位 移 量 字段 

作为 一 般 的 规则 ， 双 操作 数 指令 中 的 一 个 操作 数 必 须 是 放 在 寄存 器 中 的 。 另 一 个 操作 可 以 
在 寄存 器 中 也 可 以 在 内 存 中 。 有 两 个 例外 情况 ， 两 个 操作 数 都 可 以 在 内 存 中 。 第 一 种 情况 是 源 
操作 数 是 立即 操作 数 ， 目 标 操作 数 在 内 存 中 。 第 二 种 情况 是 在 处 理 器 堆栈 上 的 压 和 信和 弹出 操作 
指令 。 堆 栈 位 于 内 存 的 堆栈 段 中 ， 它 可 以 将 一 个 内 存 操作 数 压 信 堆栈 或 从 堆栈 中 将 一 个 操作 数 
弹出 到 内 存 中 。 我 们 将 在 后 面 的 3.22 节 中 讨论 这 个 内 容 。 

当 两 个 操作 数 都 在 寄存 器 中 时 ， 只 需要 一 个 寻 址 方式 字 节 。 例 如 ， 指 令 

ADD EAX,EDX 


被 编码 成 两 个 字 节 。 第 一 个 字 节 包含 操作 码 ， 另 一 个 是 寻 址 方式 字 节 ， 用 来 指定 两 个 寄存 器 。 
现在 ， 让 我 们 考虑 几 个 指令 编码 ， 其 中 一 个 操作 数 在 寄存 器 中 ， 另 一 个 操作 数 在 内 存 中 。 
图 3-40 程 序 中 的 指令 
MOV ECX,N 


被 编码 成 六 个 字 节 : 一 个 字 节 是 操作 码 ; 一 个 字 节 是 寻 址 方式 字 节 ， 它 指定 直接 方式 以 及 目标 
寄存 器 ECX; 四 个 字 节 用 于 内 存单 元 N 的 地 址 。 
该 程序 中 的 指令 


ADD EAX,[EBX+EDI*4] 


由 于 使 用 了 两 个 寄存 器 来 产生 源 操作 数 的 有 效 地址 ， 所 以 寻 址 方式 字段 的 字 节 需要 两 个 字 节 。 比 
例 因子 4 包含 在 这 两 个 字 节 中 的 第 二 个 字 节 中 。 这 样 ， 指令 全 长 需要 三 个 字 节 ， 包 括 操作 码 字 节 。 
第 三 个 例子 来 考虑 指令 
MOV DWORD PTR [EBP+ESI* 4+DISP],10 


汇编 指示 DWORD PTR 用 来 说 明 立 即 操作 数 10 的 长 度 是 32 位 的 。 在 其 他 的 汇编 程序 中 ， 操 作 数 长 
度 的 说 明 通常 是 包含 在 操作 码 助 记 符 中 的 。 例 如 ， 在 本 章 部 分 II 中 讨论 的 Motorola 68000, 
MOVE.B 指 定 的 是 单字 节 的 操作 数 ，MOVE.L 指 定 的 是 4 字 节 的 长 字 操 作 数 。 如 果 使 用 的 是 32 位 
的 位 移 量 DISP， 那 么 这 条 指令 的 编码 需要 11 个 字 节 : 一 个 字 节 用 于 操作 码 ; 两 个 字 节 用 于 寻 直 
方式 字段 ， 每 个 位 移 量 和 立即 数字 段 都 需要 四 个 字 节 。 在 表 3-3 中 说 明了 位 移 量 的 长 度 可 以 是 8 位 
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或 32 位 的 。 在 寻 址 方式 的 两 个 字 节 中 的 第 一 个 字 节 里 指定 了 长 度 。 
在 双 操 作 数 指令 的 编码 中 ， 寄 存 器 操作 数 和 内 存 操作 数 是 按照 固定 的 顺序 说 明 的 。 首 先 说 
明 的 总 是 寄存 器 操作 数 。 为 了 将 指令 
MOV EAX,LOCATION 
(将 内 存 中 LOCATION 处 的 内 容 装 入 到 寄存 器 EAX 中 ) 和 指令 
MOV LOCATION, EAX 
(将 寄存 器 EAX 的 内 容 存 储 到 LOCATION 中 ) 进行 区 别 ， 在 操作 码 字 节 中 包含 一 位 称 为 方向 位 的 
特殊 位 ， 这 个 位 用 来 指明 哪个 操作 数 是 源 操作 数 。 
在 IA-32 体 系 结构 中 ， 操 作 码 和 寻 址 方式 的 编码 稍微 有 些 复杂 ， 并 且 还 有 很 多 的 不 一 致 和 例 
外 的 情况 。 虽 然 这 使 得 编译 器 充分 利用 指令 系统 和 寻 址 方式 的 全 部 特征 有 些 困 难 ， 但 是 这 也 无 
疑 是 IA-32 体 系 结构 非常 强大 和 灵活 的 特征 。 
附录 D 中 给 出 了 IA-32 指 令 的 总 结 ， 以 及 在 个 人 计算 机 上 输入 和 运行 汇编 语言 程序 的 指南 。 


3.18 1IA-32 汇 编 语 言 


通过 图 3-40 中 的 程序 ， 说 明了 IA-32 汇 编 语 言 对 于 操作 码 、 寻 址 方式 和 指令 地 址 标志 具体 指 
明 的 基本 情况 。 正 如 2.6.1 节 中 描述 的 那样 ， 汇 编 指 示 对 定义 一 个 程序 的 数据 区 域 和 数据 单元 符 
号 名 称 及 实际 的 物理 地 址 值 之 间 的 通信 是 必要 的 。 

图 3-40b 中 程序 的 完整 汇编 语言 程序 如 图 3-42 所 示 。.data 和 -code 汇编 指示 定义 了 程序 的 数据 
和 代码 (指令) 部 分 的 起 始 位 置 。 在 数据 区 中 ，DD 指 示 符 分 配 了 4 字 节 的 双 倍 字数 据 单 元 。 
NUMI1 是 五 个 双 倍 字 中 的 第 一 个 字 的 地 址 标号 ， 这 五 个 双 倍 字 初 始 化 成 十 进 制 数 17、3、- 51. 
242 和 - 113。 下 两 个 双 倍 字 单 元 ( 初 值 为 5 和 和 0) 给 出 了 地 址 标号 N 和 SUM。 

在 代码 区 指令 的 寻 址 方式 中 ， 使 用 了 三 个 在 数据 区 中 声明 的 符号 名 。MAIN 标 号 用 来 说 明 指 
令 执行 的 开始 地 址 ， 该 标号 用 在 结束 程序 文本 文件 的 END 指 示 符 所 在 的 模块 。 其 他 的 汇编 指示 ， 
如 在 2.6.1 节 中 讨论 的 EQU， 也 是 可 以 使 用 的 。 


17,3,-51,242,-113 
5 
0 


LEA EBX,NUMI 


SUB EBX,4 
MOV ECX,N 
产生 机 器 指令 的 语句 MOV EAX,0 
STARTADD : ADD EAX,[EBX+ECX * 4] 
LOOP STARTADD 
MOV SUM,EAX 


END MAIN 





图 3-42 完全 采用 1A-32 汇 编 语言 编写 的 图 3-40b 中 的 程序 
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3.19 程序 流 控制 


有 两 种 主要 方法 可 以 改变 指令 的 直线 执行 顺序 流程 。 调 用 子 程序 并 从 子 程序 返回 可 以 打破 
这 种 直线 执行 ， 这 些 要 在 3.22 节 中 介绍 。 还 有 转移 指令 ， 无 论 是 条 件 转移 还 是 无 条 件 转移 ， 也 可 
以 改变 这 种 流程 。 我 们 现在 讨论 转移 指令 。 在 IA-32 的 术语 中 ， 转 移 指令 称 为 跳 转 (Jump). 


3.19.1 条 件 跳 转 及 条 件 码 标志 


我 们 将 图 3-40a 中 的 指令 
JG STARTADD 


作为 条 件 跳 转 指令 的 例子 。 条 件 是 “大 于 0”， 在 条 件 码 中 用 G 后 缀 来 表示 。 这 个 条 件 与 刚刚 执行 
完 的 数据 操作 指令 的 结果 有 关 ， 在 本 例 中 该 指令 是 
DEC ECX 


指令 (如 递 碱 、 加 法 或 其 他 算术 运算 和 比较 操作 指令 ) 生成 的 结果 属性 ， 记 录 在 处 理 器 状态 寄 
存 器 中 的 四 个 条 件 码 标志 位 中 ， 如 图 3-37 所 示 。 这 些 属性 称 为 SF (符号 )、ZF ($), OF (RH) 
和 CF (进位 ) 标志 ， 与 在 2.4.6 节 中 描述 的 方式 一 样 进行 置 ! 或 清 0。 它 们 分 别称 为 N、Z、V 和 C， 
但 有 一 个 例外 。 对 于 减法 操作 ，CF 在 没有 进位 时 候 被 设置 成 1， 表 示 借 位 信号 。 后 面 的 条 件 跳 转 
指令 可 以 对 标志 位 进行 检测 ， 以 此 来 确定 是 否 执行 跳 转 操作 。 在 我 们 的 例子 中 ， 如 果 条 件 
[ECX>0， 执 行 控制 将 切换 到 跳 转 目标 地 址 STARITADD 处 的 指令 执行 。 

条 件 跳 转 指令 中 并 不 包含 跳 转 目 标 地 址 是 绝对 地 址 的 情况 ， 而 是 包含 一 个 带 符号 数 ， 将 该 
数 与 指令 指针 寄存 器 中 的 内 容 相 加 来 确定 目标 地 址 。 这 样 ， 目 标 地 址 与 指令 指针 中 的 地 址 相关 。 
在 一 条 指令 取出 后 执行 的 第 一 步 操作 是 将 指令 指针 提前 指向 下 一 条 指令 。 因 此 ， 在 跳 转 目标 地 
址 与 相对 偏 移 量 相 加 时 ， 指 令 指针 中 包含 的 是 紧 跟 在 跳 转 指令 之 后 的 指令 地 址 。 在 我 们 的 例子 
中 ， 假 定 地 址 STARTADD 是 1000。 图 3-40a 中 需要 编码 的 四 条 指令 ADD、INC、 DEC 和 JG 的 总 字 
节 数 是 7 个 字 节 。 指 令 指 针 寄 存 器 EP 的 更 新 内 容 是 1007， 也 就 是 程序 中 的 最 后 MOV 指 令 的 地 址 。 
因此 ， 到 跳 转 目标 地 址 的 相对 地 址 是 - 7， 也 就 是 保存 在 条 件 跳 转 指令 中 的 值 。 这 个 小 负数 可 以 
用 一 个 字 节 表示 。 所 以 ， 当 相对 目标 地 址 是 在 - 128 到 +127 之 间 时 ， 包 括 操 作 码 字 节 需要 编码 的 
条 件 跳 转 指令 只 需要 两 个 字 节 。 当 使 用 4 字 节 的 偏 移 量 时 ， 跳 转 的 目标 地 址 范围 会 更 大 。 

在 本 例 中 ， 要 检测 ECX 寄 存 器 减 小 后 的 结果 ， 看 它 是 否 是 大 于 0。 结 果 的 其 他 算术 属性 可 以 
用 不 同 的 条 件 跳 转 指令 来 检测 。 例 如 ， 对 于 带 有 操作 码 ]Z (或 正 ) 和 JS 的 指令 ， 分 别 在 等 于 0 和 
符号 位 是 1 (负数 ) 的 时 候 进行 跳 转 。 


比较 指令 
程序 中 要 经 常 根据 比较 两 个 数值 的 结果 进行 条 件 跳 转 。 比 较 指令 
CMP dst, src 
执行 的 操作 是 


[dst ] - [ src] 
根据 获得 的 结果 来 设置 条 件 码 标志 。 但 这 时 任何 一 个 操作 数 都 不 会 改变 ， 总 是 第 一 个 操作 数 与 
第 一 个 操作 数 进行 比较 。 例 如 ， 如 果 通 过 一 个 “大 于 ”的 条 件 指令 来 跟踪 比较 指令 ， 那 么 希望 
如 果 目 标 操 作 数 大 于 源 操作 数 时 就 跳 转 到 目标 地 址 处 。 
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3.19.2 无 条 件 跳 转 


一 个 无 条 件 跳 转 指令 JMP 是 一 定 要 产生 转移 到 目标 地 址 处 的 指令 。 除 了 使 用 短 (一 个 字 节 ) 
或 长 四 个 字 节 ) 的 相对 符号 偏 移 量 来 确定 目标 地 址 以 外 ， 像 在 条 件 跳 转 指令 中 一 样 ，JMP 指 令 
也 可 以 使 用 其 他 的 寻 址 方式 ， 这 种 灵活 性 在 产生 目标 地 址 中 是 非常 有 用 的 。 考 虑 在 很 多 高 级 语 
言 中 的 Case 语 句 。 在 程序 中 的 某 处 ， 需 要 在 很 多 的 选择 计算 中 执行 一 个 正确 的 计算 ， 其 中 每 一 个 
计算 涉及 一 种 情况 。 假 定 这些 情 况 中 每 一 个 程序 的 第 一 条 指令 的 4 字 节 地 址 保存 在 内 存 中 的 一 张 
表 中 ， 表 的 起 始 位 置 是 IUMPTABLE。 如 果 这 些 情况 是 采用 0, 1, 2… 进 行 编号 的 ， 要 执行 情况 
(Case) 的 变 址 保存 在 寄存 器 ESI 中 ， 那 么 通过 执行 指令 

JMP [JUMPTABLE +ESI*4] 


就 完成 到 选择 情况 的 跳 转 操 作 ， 其 中 使 用 的 是 带 位 移 量 的 变 址 寻 址 方式 。 
3.20 逻辑 和 移 位 /循环 移 位 指令 


3.20.1 人 逻辑 操作 


IA-32 体 系 结构 中 具有 执行 逻辑 与 、 或 和 异 或 操作 的 指令 。 这 种 指令 对 两 个 操作 数 进行 位 操 
作 ， 将 其 结果 保存 在 目标 地 址 中 。 例 如 ， 假 设 在 寄存 器 EAX 中 保存 着 十 六 进 制 数 0000FFFF， 寄 
存 器 EBX 中 的 值 是 02FA62CA。 那 么 指令 

AND EBX, EAX 


将 EBX 中 的 左 半 部 分 全 部 清 0， 后 半 部 分 保持 不 变 。 结 果 放 在 EBX 中 为 000062CA。 
指令 系统 中 还 有 一 条 NOT 指 令 ， 对 操作 数 的 所 有 位 进行 逻辑 求 反 ， 也 就 是 将 全 部 的 1 变 成 0， 
全 部 的 0 变 成 1。 


3.20.2 移 位 与 循环 移 位 操作 


利用 逻辑 移 位 或 算术 移 位 可 以 将 一 个 操作 数 左 移 或 右 移 ， 给 出 的 数值 是 决定 要 移动 的 位 数 。 

移 位 指令 的 格式 是 
Opcode dst, count 

其 中 要 移 位 的 目标 操作 数 通 过 一 般 的 寻 址 方式 指定 ，count 可 以 用 一 个 8 位 的 立即 数 给 出 ， 也 可 以 
放 在 一 个 8 位 寄存 器 CL 中 。 共 有 四 条 移 位 指令 : 

SHL 逻辑 左 移 

SHR ”逻辑 右 移 

SAL ”算术 左 移 (与 SHL 相 同 ) 

SAR AREE 

移 位 操作 已 在 2.10 中 进行 了 讨论 并 用 图 2-30 举 例 做 了 说 明 。 

还 有 四 条 循环 移 位 指令 。 它 们 是 针对 不 带 进位 标志 CE 的 向 左 循环 和 向 右 循环 移 位 指令 ROL 
和 ROR ， 带 有 CF 的 RCL 和 RCR 循环 移 位 指令 。 所 有 这 四 种 操作 已 在 图 2-32 做 了 说 明 。 

数字 打包 程序 

作为 这 些 指令 的 一 个 简单 应 用 ， 考 虑 图 2-31 中 的 BCD 数 字 打包 程序 ， 该 程序 的 IA-32 代 码 如 
图 3-43 所 示 。 寄 存 器 AL 和 BL 中 装 有 两 个 ASCH 码 字 节 。SHL 指 令 将 AL 中 的 字 节 左 移 四 位 ， 低 位 
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部 分 用 0 填充 。 在 该 指令 中 操作 数字 段 的 第 二 个 数 是 表示 要 传送 的 位 数 。AND 指 令 将 第 二 个 字 节 
的 高 四 位 清 0。 最 后 ， 使 用 OR 指令 将 所 期 望 的 4 位 


形式 的 BCD 码 合并 到 AL 中 ， 之 后 保存 到 内 存 的 字 和 
节 单 元 PACKED 中 。 AL,4 左 移 4 位 

BL,[EBP+1] “将 第 二 个 字 节 载 信 BL 
3.21 VO 操作 BL,OFH 将 高 四 位 清 0 


AL,BL 连接 BCD 数 
PACKED,AL 保存 结果 





3.21.1 存储 器 映射 /O 图 3-43 将 两 个 BCD 数 字 打 包 成 一 个 
在 现代 的 计算 机 系统 中 ， 对 输入 /输出 设备 组 字 节 的 IA-32 程 序 
冲 区 寄存 器 访问 的 最 常用 方法 是 在 2.7 节 中 描述 的 存储 器 映射 /0 方 法 。IA-32 的 传送 指令 可 以 将 指 
示 传 送 给 IO 设备 ， 并 可 以 将 数据 和 状态 信息 与 设备 之 间 进 行 来 回 传送 。 例 如 ， 假 设 键盘 和 显示 
设备 具有 同步 标志 SIN 和 SOUT (参见 图 2-19)， 它 们 分 别 保 存在 设备 状态 寄存 器 INSTATUS 和 
OUTSTATUS 中 的 第 3 位 中 。 采 用 程序 控制 Jo ， 使 用 下 面 的 等 待 循 环 ， 可 以 完成 从 键盘 缓冲 寄存 
器 DATAIN 中 读 和 人 一 个 字 节 放 到 寄存 器 AL 中 : 
READWAIT: BT INSTATUS, 3 
JNC READWAIT 
MOV AL,DATAIN 
指令 BT 是 一 个 位 检测 指令 。 源 操作 数 指定 的 目标 位 置 值 (在 本 例 中 就 是 立即 数 3) 装 入 到 进位 标 
志 CF 中 。 条 件 跳 转 JNC (如 果 无 进位 就 跳 转 ) 在 CF=0 时 引起 跳 转 到 READWAIT 处 。 
与 此 类 似 ， 输 出 操作 将 寄存 器 AL 中 的 一 个 字 节 发 送 到 显示 缓冲 寄存 器 DAIAOUT 中 ， 实 现 如 下 : 
WRITEWAIT BT OUTSTATUS,3 
JNC WIRTEWAIT 
MOV DATAOUT, AL 
图 3-44 中 给 出 的 是 一 个 IA-32 程 序 ， 它 从 键盘 上 读 取 一 行 字符 将 其 保存 在 以 LOC 为 开始 内 存 
地 址 中 ， 并 将 这 些 字 符 显示 出 来 。 该 程序 是 模仿 图 2-20 中 的 一 般 程序 。 寄 存 器 EBP 指 向 该 行 字符 
保存 的 内 存 区 。 l 


EBP .LOC EBP 指向 内 存 区 

INSTATUS,3 ”等 待 有 字符 输入 到 DATAIN 中 
READ 

AL,DATAIN 将 字符 传送 到 AL 中 

[EBP],AL 把 字符 保存 到 内 存 ， 并 增加 指针 
EBP 

OUTSTATUS,3 “等待 显示 就 绪 


ECHO 


DATAOUTAL 向 显示 器 发 送 字符 


AL,CR 如 果 不 是 回 车 ， 继 续 读 取 字 符 
JNE READ 





图 3-44 读 取 一 行 字符 并 显示 出 来 的 IA-32 程 序 
3.21.2 独立 IJO 
IA-32 指 令 系 统 中 还 有 两 条 操作 码 是 IN 和 OUT 的 指令 ， 它 们 只 能 用 于 WO。 这 些 指令 所 产生 的 
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地 址 在 另 一 个 地 址 空间 中 ， 它 与 其 他 指令 使 用 的 地 址 空间 相互 独立 。 这 种 安排 称 为 独立 IO 以 区 
别 于 存储 器 映射 TO， 而 后 一 种 的 IO 设备 可 寻 址 单元 与 内 存单 元 所 用 的 地 址 空间 是 相同 的 。 这 两 
种 地 址 空间 都 可 以 用 在 Intel 处 理 器 芯片 同样 的 地 址 和 数据 线 上 ， 并 使 用 一 条 输出 控制 线 来 说 明 当 
前 指令 正在 引用 的 是 哪个 地 址 空间 。 
在 字 节 可 寻 址 的 WO 地 址 空间 中 使 用 的 是 16 位 的 地 址 。8 位 和 32 位 的 1/O 设 备 操作 数 单元 用 来 
保存 数据 、 状 态 和 命令 信息 。 输 入 指令 使 用 的 格式 是 
IN REG, DEVADDR 
这 里 目标 REG 必 须 是 寄存 器 AL 或 EAX， 分 别 表示 一 个 8 位 或 32 位 的 操作 数 的 传递 。 指 令 中 的 最 后 
字段 包含 8 位 的 设备 地 址 DEVADDR。 相 应 的 输出 指令 是 
OUT DEVADDR, REG 
由 于 地 址 空间 是 字 节 可 寻 址 的 ， 向 处 理 器 发 送 一 个 8 位 ASCII 字 符 的 键盘 设备 有 字 节 地 址 为 
DEVADDR 的 数据 缓冲 寄存 器 ， 而 它 的 8 位 状态 寄存 器 在 地 址 DEVADDR+1 处 。 
整个 的 16 位 VO 地 址 空间 范围 是 64K; 它 可 以 通过 输入 指令 
IN REG, DX 


中 的 DX 寄存 器 来 引用 。 像 前 面 一 样 ，REG 必 须 是 AL 或 EAX。16 位 的 设备 地 址 包含 在 DX 寄 
存 器 中 ， 它 是 EDX 寄 存 器 的 低 16 位 ， 数 据 传送 的 宽度 是 由 REG 操 作 数 的 大 小 来 决定 的 。 相 应 的 
输出 指令 是 


OUT DX, REG 


3.21.3 块 传送 


在 处 理 器 和 IO 设备 之 间 除 了 传送 单个 信息 项 的 指令 IN 和 OUT 外 ，IA-32 体 系 结构 还 有 两 个 块 
传送 IO 指令 : REPINS 和 REPOUTS。 它 们 在 内 存 和 HMO 设 备 之 间 串 行 地 传送 一 批 数据 项 ， 每 次 传 
送 一 项 。 操 作 码 中 的 S 后 级 表示 字符 申 ，REP 前 绿 表 示 “ 逐 项 地 反复 传送 ， 直 到 整 块 传送 完毕 ”。 
指令 本 身 并 没有 指定 用 来 描述 传送 的 参数 ， 这 些 指定 参数 是 隐 含 在 处 理 器 寄存 器 DX、EDI 和 
ECX 中 的 ， 内 容 如 下 : 

DX 包含 一 个 16 位 IO 设备 地 址 。 

EDI 包含 一 个 32 位 内 存 块 的 起 始 地 址 。 

ECX 包含 的 是 要 传送 的 数据 项 的 数目 。 

操作 码 助 记 符 中 的 后 绥 B 或 D 表 示 数 据 项 长 度 是 一 个 字 节 或 一 个 双 字 长 。 这 样 ，REPINSB 
就 是 字 节 块 传送 ，REPINSD 是 双 字 块 传送 。 块 传送 指令 操作 如 下 : 在 每 个 数据 项 传送 完 之 后 ， 
变 址 寄存 器 EDI 将 根据 数据 项 的 长 度 来 增加 1 或 4，ECX 寄 存 器 减 1。 传 送 将 一 直 重 复 直 到 计数 
寄存 器 ECX 的 内 容 为 0 为 止 。 这 条 单 指令 的 作用 等 价 于 使 用 寄存 器 ECX 作 为 循环 计数 器 的 循环 
程序 。 

看 一 个 例子 ， 假 设 从 一 个 磁盘 存储 设备 向 内 存 中 传送 一 个 具有 128 个 双 字 的 块 。 假 定 磁盘 设 
和 的 可 寻 址 数据 缓冲 寄存 器 中 包含 一 个 双 字数 据 项 以 及 IO 地 址 DISKDATA 。 要 写 进 内 存 的 数据 
块 的 开始 地 址 是 MEMBLOCK ， 计 数 寄存 器 ECX 初 始 化 成 128 ， 指 令 序列 

LEA EDI, MEMBLOCK 
MOV DX, DISKDATA 
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MOV ECX,128 
REPINSD 
可 以 用 来 完成 传送 。 程 序 中 假定 MEMBLOCK 已 经 定义 为 一 个 地 址 标号 ， 并 已 使 用 EQU 汇 编 
指示 将 DISKDATA 定 义 成 表示 16 位 的 设备 数据 缓冲 寄存 器 的 地 址 。 
这 里 讨论 的 是 独立 MO 是 如 何 组 织 的 ， 同 时 还 指出 一 个 多 数据 项 的 块 传 送 是 如 何 通过 使 用 地 
址 计数 器 (EDI) 和 数据 项 计数 器 (ECX) 的 单 指令 来 完成 的 。 


3.22 FEF 


像 2.9 节 中 阐明 的 那样 ， 处 理 器 堆栈 数据 结构 是 为 了 便于 处 理子 程序 的 进入 和 返回 的 。 在 IA- 
32 体 系 结构 中 ， 寄 存 器 ESP 用 作 堆 栈 指针 ， 指 向 处 理 器 堆栈 当前 栈 顶 元 素 《TOS)。 堆 栈 的 增长 
方向 是 内 存 地 址 的 低地 址 方向 。 这 种 安排 与 2.8 节 中 讨论 的 相同 , 在 图 2-21 和 图 2-22 中 进行 了 说 明 。 
堆栈 的 宽度 是 32 位 ， 也 就 是 全 部 的 堆栈 元 素 都 是 双 字 长 的 。 
有 四 条 压 栈 和 弹出 指令 。 指 令 
PUSH src 
将 ESP 减 4， 然 后 将 src 处 的 双 倍 字 保 存 到 内 存 中 ESP 指 向 的 位 置 处 。 指 令 
POP dst 


是 相反 的 过 程 ， 释 放 被 ESP 指 向 的 TOS 处 的 栈 顶 双 倍 字 ， 将 其 保存 在 dst 处 ， 然 后 ESP 加 4， 这 样 有 
效 地 将 栈 顶 (TOS) 元 素 从 堆栈 中 移出 。 这 些 指令 中 暗含 着 将 ESP 作 为 堆栈 指针 。 源 操作 数 和 目 
标 操作 数 采用 IA-32 寻 址 方式 来 指定 。 两 条 指令 可 以 压 人 或 弹出 多 个 寄存 器 中 的 内 容 。 指 令 
PUSHAD 
可 以 将 全 部 的 八 个 通用 寄存 器 EAX 到 EDI 中 的 内 容 压 和 人 堆栈， 指令 
POPAP 


将 它们 按照 相反 的 顺序 弹出 。 当 POPAD 到 达 保存 在 ESP 中 原来 的 栈 顶 时 ， 它 将 丢弃 这 四 个 字 节 并 
把 它们 放 入 到 ESP 中 ， 并 将 剩余 的 值 继续 弹出 分 别 放 到 各 自 的 寄存 器 中 。 这 两 条 指令 作为 实现 子 
程序 的 一 部 分 ， 用 于 有 效 地 保存 和 恢复 全 部 寄存 器 中 的 内 容 。 

图 3-40a 中 的 列表 加 法 程序 可 以 写成 一 个 如 图 3-45 所 示 的 子 程序 ， 参 数 通过 寄存 器 进行 传送 。 
调用 程序 将 相 加 数 的 第 一 个 数 的 内 存 地址 NUM1 装 入 到 寄存 器 EBX 中 ， 相 加 数 的 个 数 保存 在 内 存 
中 的 N 处 , 被 装 入 到 寄存 器 ECX 中 。 调 用 程序 希望 得 到 的 列表 数据 相 加 的 和 通过 寄存 器 EAX 返 回 。 
这 样 ， 寄 存 器 EBX、ECX 和 EAX 就 用 来 传送 参数 。 寄 存 器 EDI 在 子 程序 在 执行 加 法 时 作为 变 址 寄 
存 器 ， 所 以 它 的 内 容 必 须 在 子 程序 中 利用 PUSH 和 POP 指 令 进行 保存 和 恢复 。 

子 程序 被 下 面 的 指令 调用 : 

CALL LISTADD 


首先 将 返回 地 址 压 人 堆栈 ， 然 后 转移 到 LISTADD 处 ， 子 程序 保存 (JEA) EDI 之 后 堆栈 的 内 
容 如 图 3-45b 所 示 。 返 回 地 址 是 调用 程序 中 紧 跟 在 调用 指令 之 后 的 MOV 指 令 的 地 址 。 指 令 RET 通 
过 将 栈 顶 元 素 弹 出 到 指令 指针 (程序 计数 器 ) EIP 中 来 将 执行 控制 返回 给 调用 程序 。 

图 3-46 给 出 的 是 对 图 3-40a 中 的 程序 使 用 堆栈 来 传送 参数 而 重新 编写 的 一 个 子 程序 。 参 数 
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NUMI1 和 7 由 调用 程序 中 的 PUSH 指令 压 人 堆栈 ， 在 执行 完 调 用 程序 以 后 栈 顶 处 于 第 二 级 。 寄 存 
器 EDI、EAX、EBX 和 ECX 在 子 程序 中 的 用 途 与 在 图 3-45 中 的 相同 。 在 子 程序 中 的 前 八条 指令 
是 将 它们 的 值 进行 保存 并 装 入 初始 值 和 参数 。 这 时 ， 栈 顶 处 于 第 三 级 。 当 数值 由 四 个 循环 指令 
相 加 完 以 后 ， 相 加 的 和 放 到 堆栈 中 ， 重 写 参 数 NUM1。 在 执行 返回 指令 Return 以 后 ， 调 用 程序 
中 的 ADD 和 POP 指 令 将 参数 4 从 堆栈 中 移出 并 将 相 加 的 和 弹出 放 到 内 存 中 的 SUM 处 ， 恢 复 栈 顶 
到 第 一 级 。 


EBX.NUMI 将 参数 载 人 EBX、ECX 中 
ECX,N 

LISTADD 转移 到 子 程序 

SUM,EAX 将 和 保存 到 内 存 中 


子 程序 


LISTADD: EDI 保存 EDI 
EDIO 将 EDI 用 作 恋 址 寄存 器 
EAX,0 将 EAX 用 作 累 加 器 
STARTADD: EAX, [EBX + EDI * 4] 加 下 一 个 数 
EDI 增加 变 址 
ECX 减 小 计数 器 
STARTADD 如 果 [ECX]>0 转 移 返 加 
EDI 恢复 EDI 
转移 返回 调用 程序 





a) 调用 程序 和 子 程序 


原 TOS 





b) 子 程序 保存 EDI 之 后 的 堆栈 内 容 
图 3-45 将 图 3-40a 的 程序 重 写 为 一 个 LA-32 子 程序 ;参数 通过 寄存 器 传送 


我 们 将 要 讨论 的 子 程序 的 最 后 一 个 例子 是 处 理 嵌 套 调用 的 情况 。 图 3-47 给 出 了 图 2-28 中 程 
序 的 IA-32 代 码 。 在 图 3-48 中 给 出 了 第 一 个 和 第 二 个 子 程序 相应 的 堆栈 结构 。 寄 存 器 EBP 用 作 结 
构 指 针 ， 调 用 程序 和 子 程序 的 结构 与 图 2-28 中 的 十 分 相近 。 图 3-47 中 的 不 同 是 在 保存 和 恢复 寄 
存 器 时 使 用 了 多 个 PUSH 和 POP 指令 来 代替 图 2-28 中 的 多 个 传送 指令 。IA-32 指 令 系 统 中 有 可 以 
将 全 部 的 八 个 通用 寄存 器 的 内 容 压 人 栈 或 弹出 栈 的 PUSHAD 和 POPAD 指 令 ， 就 像 本 节 前 面 描述 
的 那样 ， 但 是 由 于 子 程序 只 使 用 了 寄存 器 集中 的 一 半 ， 所 以 我 们 在 图 3-47 中 选择 使 用 单个 PUSH 
和 POP 指令 。 


3.23 其 他 指令 
前 面 我 们 描述 的 只 是 整个 IA-32 指 令 系统 中 的 一 小 部 分 。 这 里 将 描述 一 些 更 重要 的 指令 。 





—2a E A 


(假定 栈 预 位 于 第 一 级 之 下 ) 
调用 程序 
PUSH OFFSET NUMI! 将 参数 压 和 人 堆栈 
PUSH N 
CALL LISTADD 转移 到 子 程序 
从 堆栈 中 移 去 n 
将 和 弹出 到 SUM 


子 程序 
LIST ADD: 保存 EDI 并 将 其 用 作 变 址 寄存 器 


保存 EAX 并 将 其 用 作 累 加 寄存 器 


保存 EBX 并 将 地 址 NUM1 载 入 
EBX,{ESP+20] 


ECX 保存 ECX 并 将 计数 值 " 载 人 
ECX,{ESP+20] 


STARTADD: EAX,[EBX+EDI *4] 加 下 一 个 数 


EDI 增加 变 址 

ECX 计数 器 减 1 

STARTADD 如 果 没 完 转移 返回 
[ESP+24],EAX 用 和 对 栈 中 的 NUM1 重 写 


Karta 





b) 不 同时 刻 的 堆栈 结构 
图 3-46 将 图 3-40a 中 的 程序 重 写 为 一 个 IA-32 子 程序 ;参数 通过 堆栈 传送 
3.23.1 姜 法 与 除法 指令 


除了 在 3.17 节 中 讨论 的 带 符号 整数 的 加 法 和 减法 指令 以 外 ， 还 有 整数 的 乘法 和 除法 指令 ， 以 
及 浮 点 数 的 乘除 法 指令 。 
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将 参数 放 入 堆栈 


Ht 


恢复 堆栈 级 别 


第 一 个 子 程序 


2100 SUBI: 保存 结构 指针 寄存 器 
载 人 结构 指针 
保存 寄存 器 


EAX,[EBP+8] 取得 第 一 个 参数 
EBX,[EBP+12] ”取得 第 二 个 参数 


PARAM3 将 参数 放 入 堆栈 中 


SUB2 
ECX 将 SUB2 结 果 弹 出 放 入 ECX 


[EBP+8],EDX 将 应 答 放 人 堆栈 
恢复 寄存 器 


恢复 结构 指针 寄存 器 
返 四 到 主 程序 

第 二 个 子 程序 

3000 SUB2: 保存 结构 指针 寄存 器 
载 和 结构 指针 
保存 寄存 器 


EAX,[EBP+8] 取得 参数 


[EBP+8], EBX 将 SUB2 结 果 放 入 堆栈 

EBX 恢复 寄存 器 

EAX 

EBP 恢复 结构 指针 寄存 器 
返回 到 第 一 个 子 程序 





图 3-47 用 IA-32 汇 编 语言 编写 的 冬 套 子 程序 


通常 ， 两 个 32 位 整数 相 乘 会 生成 一 个 双 倍 长 的 64 位 乘积 。 然 而 ， 在 很 多 应 用 中 ， 乘 积 被 认 
为 是 一 个 单 倍 长 度 的 32 位 结果 。 对 于 这 两 种 情况 存在 不 同 的 指令 。 对 于 后 一 种 情况 则 是 更 常用 
的 ， 指 令 
IMUL REG, src 
将 单 倍 长 度 的 乘积 放 到 目标 单元 中 ， 这 个 目标 单元 必须 是 通用 寄存 器 REG 。 源 操作 数 可 以 在 寄 
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存 器 或 内 存 中 。 对 于 第 一 种 情况 ， 指 令 
IMUL src 










[EBX] 来 自 SUB1 
[EAX] 来 自 SUB1 





第 二 个 子 
使 用 EAX 寄存 器 作为 目标 寄存 器 ， 源 操作 数 可 以 在 ”Eap 一 = 程序 的 堆 
寄存 器 或 内 存 中 。 双 倍 长 度 乘积 放 在 寄存 器 EDX Rast 
(高 位 部 分 ) 和 EAX (低位 部 分 ) 中 。 
整数 的 除法 指令 格式 是 
IDIV src 
源 操作 数 (src) 是 除数 。 被 除数 假定 是 在 寄存 器 aa 
EAX 中 。 结 果 中 的 商 保存 在 EAX 中 ， 余 数 保存 在 各 
EDX 中 。 在 指令 执行 之 前 ，EAX 中 的 被 除数 必须 进 ”EPEP 一 一 RAH 
行 符号 扩展 ， 然 后 放 到 EDX 中 。 这 是 由 指令 CDQ [o | 
(convert doubleword to quadword 一 一 将 双 倍 字 长 转 pm | 
换 成 四 倍 字 长 ) 来 完成 的 ， 该 指令 没有 操作 数 ， 因 
为 使 用 的 寄存 器 假定 是 EAX 和 EDX。 | |- 一 smos 


浮 点 数 将 在 第 6 章 中 描述 ， 它 具有 比 整 数 更 大 
的 范围 ， 主 要 用 于 科学 计算 中 。 对 整个 范围 内 的 算 
术 操作 都 提供 了 指令 。 操 作 数 和 结果 保存 在 浮 点 寄存 器 中 ， 如 图 3-37 所 示 。 在 本 指令 集中 支持 单 
精度 (32 位 ) 和 双 精 度 《64 位) 两 种 格式 。 


3.23.2 多 媒体 扩展 (MMX) 指令 


图 3-48 图 3-47 的 IA-32 堆 栈 结构 


一 个 二 维 图 形 或 视频 图 像 可 以 用 一 个 包含 大 量 采样 图 像 点 的 数组 来 表示 。 每 个 点 的 颜色 和 
亮度 称 为 像素 ， 可 以 被 编码 成 一 个 8 位 的 数据 项 。 这 样 的 数据 处 理 具 有 两 个 主要 特点 。 第 一 个 特 
点 是 单个 像素 的 操作 通常 只 包括 非常 简单 的 算术 或 逻辑 操作 ， 另 一 个 特点 是 对 于 一 些 实时 的 应 
用 可 能 需要 非常 高 的 计算 速度 。 而 对 于 采样 的 音频 信号 或 语音 处 理 (在 一 定 的 时 间 间 隔 内 对 连 
续 的 模拟 信号 进行 采样 并 用 一 系列 带 符号 数 来 表示 ) 来 说 ， 也 具有 这 些 特点 。 

在 这 两 种 应 用 中 ， 如 果 单 个 数据 项 是 字 节 或 16 位 字 ， 并 可 以 打包 成 能 并 行 处 理 的 小 组 ， 那 
么 就 可 以 获得 很 高 的 处 理 效率 。IA-32 指 令 系统 中 有 很 多 将 这 样 的 数据 打包 成 64 位 的 四 字 指 令 
(一 个 四 字 中 包含 八 个 字 节 或 四 个 16 位 的 字 )。 这 些 指令 称 为 多 媒体 扩展 (MMX) 指令 。 操 作 数 
可 以 在 内 存 或 八 个 浮 点 寄存 器 中 ， 这 样 ， 这 些 寄 存 器 具有 两 种 服务 目的 。 它 们 可 以 保存 浮 点 数 
或 MMX 操 作 数 ; 当 被 MMX 指令 使 用 时 ， 这 些 寄存 器 作为 MM0 到 MM7 来 引用 。 

在 内 存 与 MMX 寄存 器 之 间 提 供 了 传送 64 位 MMX 操作 数 的 传送 指令 。 指 令 

PADDB MMi, src 


将 两 个 8 字 节 操作 数 中 的 相应 字 节 独立 相 加 ， 并 将 八 个 相 加 和 放 到 目的 寄存 器 中 。 源 操作 数 可 以 
在 内 存 或 在 一 个 MMX 寄存 器 中 ， 但 是 目的 地 必须 是 一 个 MMX 寄存 器 。 对 于 减法 和 逻辑 操作 也 
提供 了 类 似 的 指令 。 

在 信号 处 理 中 的 一 个 公共 操作 是 将 输入 信号 样本 的 一 个 短 时 间 序列 与 称 为 权 的 常量 相 乘 ， 
并 将 乘积 相 加 产生 一 个 输出 信号 样本 。 还 有 一 个 将 乘法 和 加 法 操作 合并 的 MMX 指令 。 它 可 以 对 
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包含 四 个 16 位 的 信号 样本 数据 项 的 64 位 MMX 操作 数 进行 操作 。 
3.23.3 向 量 (SIMD) 指令 


这 里 提供 了 一 组 用 来 对 小 组 的 浮 点 数 进行 算术 操作 的 指令 。 在 科学 计算 中 ，SIMD ( 单 指令 
多 数据 ) 对 于 向 量 和 和 托 阵 计算 是 非常 有 用 的 。 在 Intel 术 语 中 ， 这 些 指令 被 称 为 流 SIMD 扩 展 
(SSE) 指令 。 它 们 处 理 的 是 由 128 位 构成 的 操作 数 ， 每 个 操作 数 由 四 个 浮 点 数组 成 。 这 些 操 作 数 
可 以 使 用 八 个 128 位 寄存 器 来 保存 (这 些 寄存 器 在 图 3-37 中 没有 给 出 )。 其 中 ， 加 法 和 乘法 是 它们 


的 两 种 基本 操作 。 它 们 对 128 位 的 复合 源 和 目标 操作 数 中 的 四 对 相应 的 32 位 操作 数 进行 操作 , 并 


将 四 个 独立 的 结果 保存 到 128 位 的 目标 单元 中 。 
3.24 实例 程序 

本 节 给 出 2.11 节 中 描述 的 实例 程序 的 IA-32 代 码 。 
3.24.1 向 量 点 积 程序 


图 3-49 所 示 的 是 对 保存 在 内 存 中 、 起 始 地 址 是 AVEC 和 BVEC 的 两 个 数值 向 量 ， 计 算 它 们 点 
积 的 IA-32 程 序 。 该 程序 是 模仿 图 2-33 中 的 一 般 的 程序 编写 的 。 在 图 3-49 中 ， 用 带 有 变 址 的 基 址 
寻 址 方式 来 对 每 个 向 量 进行 连续 访问 。 寄 存 器 EDI 当 作 变 址 寄存 器 。 由 于 向 量 元 素 假 定 为 双 字 
(4 字 节 ) 数 ， 所 以 使 用 了 一 个 比例 因子 4。 寄 存 器 ECX 当 作 循 环 计 数 器 ， 初 始 值 为 +。 这 里 允许 
使 用 LOOP 指 令 (参见 3.17 节 和 图 3-40b)， 首 先 ECX 减 1， 之 后 如 果 ECX 的 内 容 没 有 到 达 0、 就 条 
件 转 移 到 目的 地 址 LOOPSTART 处 。 两 个 向 量 元 素 的 乘积 假定 是 可 以 放 在 一 个 双 字 中 的 ， 乘 法 指 
令 IMUL 明 确 指定 了 所 需 的 目标 寄存 器 EDX， 正 如 在 3.23 节 中 描述 的 那样 。 


EBP 指 向 向 量 A 

EBX 指 向 向 量 B 

ECX 用 作 循 环 计数 器 
EAX 累积 点 积 
BDI 是 变 址 寄存 器 


LOOPSTART: EDX,[EBP+EDI * 4] 计算 下 一 元 素 的 点 积 
EDX,[EBX+EDI * 4] 
EDI 增加 变 址 
EAX. EDX 加 到 先前 的 和 中 
LOOPSTART 如 果 设 完成 就 转移 返回 
DOTPROD,EAX 将 点 积 保存 到 内 存 中 





图 3-49 IA-32 点 积 程序 


3.24.2 字 节 排序 程序 


图 3-50b 中 所 示 的 是 图 2-34b 中 的 字 节 排序 的 IA-32 代 码 程序 。 寄 存 器 EAX 中 装 入 地 址 LIST， 
用 带 有 变 址 的 基 址 寻 址 方式 访问 列表 中 当 作 基 址 的 寄存 器 。 寄 存 器 EDI 在 外 部 循环 中 当 作 变 址 j 
的 变 址 寄存 器 ， 寄 存 器 ECX 作 为 内 部 循环 的 变 址 上 的 变 址 寄存 器 。 寄 存 器 DL 在 遍历 每 个 子 表 时 
保存 当前 最 大 的 字 节 。 在 图 3-$0b 与 图 2-34b 的 程序 中 ,除了 LIST (k) 与 LIST (j) 的 交换 指令 不 同 
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之 外 ， 其 余 的 指令 都 是 相同 的 。 在 IA-32 代 码 中 使 用 一 条 单 指 令 XCHG 就 可 以 实现 这 个 功能 ， 而 
在 一 般 的 代码 中 要 用 到 三 条 指令 和 一 个 临时 寄存 器 。 


for (= n-1l;j> 0;;i= j- 1) 
[for (k= j-1;k>= 0 Ek=k- 1) 
[if (LIST[k] > LIST[;) 
{ TEMP = LIST[K}: 
LIST[k] = LISTI/]:; 


LIST[j] = TEMP; 





a) C 语 言 的 排序 程序 


EAX,LIST 载 人 列表 指针 基 址 寄存 器 (EAX )， 
EDLN 并 初始 化 外 部 循环 变 址 寄存 器 ( EDI ) 
EDI 为 j=n-1 


ECX,EDI 初始 化 内 部 循环 变 址 寄存 器 (ECX) 

ECX 为 k=j -1 

DL [EAX + EDI] 将 LIST()) 载 人 到 寄存 器 DL 中 

[EAX + ECX],DL HLIST (k) 和 LIST()) 进 行 比较 

NEXT 如 果 LIST (k) < LIST (j) 转向 下 面 
较 低 的 变 址 项 

[EAX + ECX],DL 否则 ， 交 换 LIST (k) 与 LIST (j) 将 
LIST (j) AADLI 


[EAX + EDH,DL 
ECX 


对 内 部 循环 变 址 / 减 1 
INNER 重复 或 终止 内 部 循环 
EDI 对 外 部 循环 变 址 j 减 1 
OUTER 重复 或 终止 外 部 循环 





b) 采用 IA-32 实 现 的 程序 
图 3-50 采用 直接 选择 排序 法 的 LA-32 的 字 节 排序 程序 


3.24.3 链表 的 插入 与 删除 子 程序 


图 3-51 和 图 3-52 中 的 插入 和 删除 子 程序 与 图 2-37 与 图 2-38 中 的 一 般 程序 对 应 比较 ， 可 以 看 出 
是 非常 相近 的 。 采 用 寄存 器 来 传送 参数 ， 寄 存 器 名 为 RHEAD 、RNEWREC、RIDNUM、 
RCURRENT 和 RNEXT， 这 些 对 于 一 般 程 序 中 的 用 法 都 是 相同 的 。 这 里 继续 使 用 了 这 些 名 称 ， 而 
没有 使 用 IA-32 中 的 EAX、EBX 等 。 第 六 个 寄存 器 RNEWID 用 来 保存 要 插入 的 新 记录 ID 号 。 在 图 
3-51 的 子 程序 中 ， 第 一 条 指令 将 新 记录 的 ID 号 装 入 到 其 中 。 子 程序 中 的 其 余部 分 指令 与 图 2-37 中 
的 子 程序 对 应 相同 。 删 除 一 条 记录 的 子 程序 如 图 3-52 所 示 ， 也 是 与 图 2-38 中 的 子 程序 逐条 指令 对 

应 相同 的 。 l 
正如 图 2-37 和 图 2-38 中 的 一 般 程序 一 样 ，IA-32 的 插入 子 程序 假定 新 记录 的 ID 号 与 表 中 的 任 
何 记录 都 不 相同 ，IA-32 的 删除 子 程序 假定 在 表 中 存在 有 一 条 与 RIDNUM 内 容 相同 的 ID 号 记录 。 
习题 3.72 和 3.73 考 虑 的 是 如 果 假设 不 成 立 ， 将 如 何 修改 子 程序 从 而 给 出 一 个 报错 信息 


En o 
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子 程序 
INSERTION: 
Š 检查 是 否 是 空 表 
如 果 是 空 ， 就 记录 变 成 单一 
记录 表 
检查 新 记录 是 否 成 为 表 头 


如 果 是 表 头 ， 使 新 记录 成 为 
表 头 
否则 ， 利 用 RCURRENT 和 


RNEXT 在 表 中 移动 来 查找 插 
入 位 置 


检查 是 否 是 表 头 
如 果 是 表 头 ， 则 移 除 


SEARCH: .否则 ， 利 用 RCURRENT 和 
LOOPSTART: ; RNEXT 在 表 中 移动 来 查找 记录 





图 3-52 从 链表 中 删除 一 条 记录 的 IA-32 子 程序 


3.25 结束 语 


本 章 讨论 了 三 种 不 同 的 指令 集体 系 结构 一 -ARM、Motorola 68000 和 Intel IA-32。ARM 和 
68000 指 令 集 分 别 对 RISC 和 CISC 设 计 风 格 进行 了 说 明 。IA-32 指 令 集 是 CISC 设 计 的 特殊 扩展 。 
ARM 指 令 集中 的 任意 指令 都 编码 成 一 个 32 位 的 字 。 只 有 数据 在 处 理 器 寄存 器 中 时 才 可 以 对 
数据 进行 操作 。 在 处 理 器 寄存 器 和 内 存 之 间 使 用 Load 和 Store 指 令 来 传送 操作 数 。 我 们 阐述 了 全 
部 指令 的 条 件 执行 ， 以 及 在 大 部 分 指令 中 传送 操作 数 的 扩展 选项 ， 这 可 以 对 普通 的 程序 任务 产 
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生 高 效 的 实现 效率 。 
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68000 是 指令 可 以 被 编码 成 可 变 内 存 字 的 指令 集 的 传统 例子 ， 这 需要 根据 将 被 执行 的 操作 数 
的 操作 复杂 性 ， 以 及 产生 所 需 内 存 操作 数 的 有 效 地 址 所 需 信息 的 情况 来 定 。 在 个 别 指令 中 可 以 


使 用 寄存 器 和 内 存 操作 数 。 


Intel IA-32 指 令 集 对 不 同 数据 类 型 进行 更 大 范围 的 操作 ， 它 具有 更 大 的 灵活 性 。 


习题 


部 分 ! ARM 


3.1 假定 在 ARM 计 算 机 中 寄存 器 和 内 存 内 容 如 下 : 


寄存 器 RO 的 内 容 是 1000; 
寄存 器 R1 的 内 容 是 2000; 
寄存 器 R2 的 内 容 是 1016;，. 
寄存 器 R6 的 内 容 是 20; 
寄存 器 R7 的 内 容 是 30; 


数 1, 2, 3, 4 5 和 6 保存 在 内 存 以 1000 开 始 的 连续 地 址 字 中 。 对 于 下 面 的 三 个 短 指令 块 ， 每 次 都 
是 以 给 定 的 初始 值 作为 起 始 地 址 ， 请 说 出 每 个 指令 块 执行 后 的 作用 是 什么 ? 


(a) LDR R8, [R0] 
LDR R9, [RO, #4] 
ADD R10, R8, R9 
(b) STR R6, [R1, # — 4]! 
STR R7, [R1,# —4]! 
LDR R8, [R1], #4 
LDR R9, [R1], #4 
SUB R10, R8, R9 
(c) LDMIA  R2!, {R4, R5} 
ADD R4, R4, R5 f 
3.2 下 面 哪 条 ARM 指 令 将 会 使 汇编 程序 指示 符 产 生 语法 错误 信息 ? 为 什么 ? 
(a) ADD R2, R2, R2 
(b) SUB RO, R1, [R2, #4] 
(c) MOV RO, #2 1010101 
(d) MOV RO, #257 
(e) ADD RO, R1, R11, LSL #8 


3. 


O 


当 使 用 Load 指 令 将 一 个 字 节 从 内 存 装 和 人 到 ARM 处 理 器 寄存 器 中 时 ， 其 高 24 位 要 被 清 为 0 ( 参 


见 3.1.2 节 )。 如 果 装 入 的 字 节 使 用 的 是 8 位 带 符号 的 补 码 表示 形式 ， 就 必须 在 它 用 于 算术 操作 
之 前 ， 对 其 所 在 的 寄存 器 进行 符号 扩展 而 变 成 32 位 。 假 设 有 这 样 的 一 个 字 节 已 经 装 人 到 寄 
存 器 RO 中 ， 编 写 一 个 程序 将 其 进行 带 符号 扩展 ， 成 为 32 位 寄存 器 的 长 度 。( 提 示 : 从 2.10.2 
节 中 描述 及 图 2-30 所 示 的 LSL、LSR 和 ASR 中 选择 适当 的 移 位 指令 进行 移 位 之 后 ， 再 用 MOV 


指令 将 RO 的 内 容 传 送 回 RO 中 ,) 
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3.4 


3.5 


3.6 


3.7 


3.8 


3.9 


编写 一 个 ARM 程 序 ， 将 寄存 器 R2 中 的 位 序 进行 翻转 。 例 如 ， 如 果 R2 的 最 初 形式 是 1110… 
0100， 那 么 在 R2 中 的 结果 就 应 该 是 0010…0111。( 提 示 : 使 用 移 位 和 循环 移 位 操作 。) 
程序 跟踪 是 在 程序 执行 期 间 某 个 特定 的 寄存 器 和 内 存 位 置 处 在 不 同时 刻 的 内 容 列表 。 列 出 
在 图 3-7 中 程序 的 BGT 指 令 的 前 三 条 指令 每 次 执行 之 后 ， 寄 存 器 RO、R1 和 R2 中 的 内 容 。 用 表 
格 的 形式 给 出 结果 ， 表 格 以 三 个 寄存 器 作为 列 头 。 用 三 行列 出 在 BGT 指 令 每 次 执行 完 之 后 
寄存 器 的 内 容 。 程 序数 据 在 图 3-8 给 出 。 
编写 一 个 ARM 程 序 ， 对 两 个 字 节 列表 中 的 相应 字 节 进行 比较 ， 将 较 大 的 字 节 放 到 第 三 个 列 
表 中 。 两 个 列表 的 起 始 位 置 分 别 是 X 和 Y， 较 大 字 节 列表 的 起 始 位 置 是 LARGER。 列 表 的 长 
度 保存 在 内 存单 元 N 处 。 
一 个 ARM 程 序 具有 如 下 的 字符 操作 任务 : 一 个 具有 n 个 字符 的 字符 中 保存 在 内 存 以 STRING 
为 起 始 地 址 的 连续 字 节 单元 处 。 另 一 个 较 短 有 m 个 字符 的 字符 申 保存 在 以 SUBSTRING 为 起 
始 地 址 的 连续 字 节 单元 处 ,该 程序 必须 在 以 STRING 单 元 开始 的 字符 捉 中 进行 查找 ， 看 是 否 
存在 一 个 包含 有 与 SUBSTRING 单 元 保存 的 字符 串 相 匹配 的 连续 子 申 。 长 度 参数 x 和 m (其 
中 n > m) 分 别 保存 在 内 存 中 的 N 和 M 处 。 如 果 找 到 了 一 个 匹配 的 子 串 ， 将 它 的 第 一 个 字 节 地 
址 保存 在 寄存 器 RO 中 ; 否则 ，R0 的 内 容 将 被 清 0。 该 程序 不 必 判 断 子 帅 是 否 重复 出 现 。 这 里 
只 需要 第 一 个 匹配 子 串 的 地 址 。 
编写 一 个 ARM 程 序 ， 生 成 一 个 长 度 为 n 的 Fibonacci 数 列 。 数列 中 的 前 两 个 数 为 Oo 和 1， 每 个 数 
等 于 前 面 两 个 数 之 和 。 例 如 ，n = 8 时 的 数列 为 

0, 1, 1, 2, 3, 5, 8, 13 


程序 中 应 该 在 以 MEMLOC 开 始 的 连续 内 存 字 中 保存 。 假 设 n 值 保存 在 单元 N 处 。 
编写 一 个 ARM 程 序 ， 将 一 个 单词 (文本 ) 的 全 部 小 写字 母 转换 成 大 写字 母 。 构 成 该 单词 的 
ASCI 字 符 保 存在 内 存 连 续 的 字 节 中 ， 它 的 起 始 位 置 为 WORD ， 以 一 个 空格 为 结束 《参见 附 
录 E 中 的 ASCI 表 )。 


3.10 对 图 2-14 中 的 成 绩 表 稍 做 修改 ， 每 个 学 生 有 j 门 测验 成 绩 。 假 设 有 n 个 学 生 。 编 写 一 个 ARM 


3.11 


3.12 


3.13 


程序 用 于 计算 每 门 测 验 的 总 分 数 并 将 这 些 总 分 数 保存 到 内 存 地 址 为 SUM, SUMH, SUM + 8, … 
的 字 中 。 测 验 的 数目 / 要 大 于 处 理 器 中 寄存 器 的 数量 ， 所 以 在 图 2-15 中 给 出 的 用 于 3 门 测验 
情况 的 程序 类 型 是 不 能 使 用 的 。 建 议 使 用 在 2.5.3 节 中 介绍 的 两 个 候 套 循环 。 内 部 循环 用 于 
累计 某 个 特定 的 测验 总 和 ， 外 部 循环 用 于 控制 测验 的 次 数 j。 假 设 j 保存 在 内 存 中 的 单元 J 
处 ， 该 单元 在 单元 N 的 前 面 。 

考虑 一 个 数值 数组 A (i, j )， 它 的 行 变 址 从 i = 0 到 ma- 1， 列 变 址 从 六 = 0 到 m - 1。 该 数组 在 
ARM 计 算 机 上 采用 按 行 存储 ， 每 行 元 素 占用 mm 个 连续 的 字 。 编 写 一 个 用 于 将 列 x 和 列 ? 按 对 
应 的 元 素 相 加 ， 并 将 相 加 的 和 保存 在 列 y 中 的 ARM 子 程序 。 变 址 x 和 y 是 通过 寄存 器 R1 和 R2 
传送 给 子 程 序 的 。 参 数 x 和 m 通 过 寄存 器 R3 和 R4 传 送 给 子 程序 ， 元 素 A (0, 0) 的 地 址 用 寄存 
器 RO 来 传送 。 可 以 使 用 玫 3-1 中 所 列 出 的 寻 址 方式 。 

编写 一 个 ARM 程 序 ， 从 键盘 读 取 x 个 字符 ， 在 读 取 这 些 字符 时 将 它们 放 入 用 户 使 用 的 堆栈 
中 ,之 后 将 这 些 字符 在 显示 器 上 显示 出 来 。 使 用 寄存 器 R6 作 为 堆栈 指针 。 字 符 个 数 n 保 存 
在 内 存 中 的 N 处 。 

假设 在 图 3-9 的 程序 中 的 一 条 指令 从 取出 到 执行 所 用 的 平均 时 间 是 20 纳 秒 。 如 果 每 秒 钟 键盘 
的 按键 次 数 是 10， 那 么 每 输入 一 个 字符 时 ，BEQ READ 指 令 大 概 执行 多 少 次 ? 这 里 假设 每 





3.14 


3.15 
3.16 


3.17 


3.18 


3.19 


3.20 


3.23 
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个 字符 的 显示 时 间 要 远 远 小 于 键盘 上 连续 输入 两 个 字符 的 时 间 。 

在 图 3-9 中 的 ARM 程 序 中 ,“in-line” 代 码 完成 的 功能 是 读 取 一 行 字符 并 将 它们 显示 出 来 。 
重新 编写 该 程序 ， 采 用 主 程序 调用 名 为 GETCHAR 的 子 程序 来 读 取 一 个 字符 ， 然 后 再 调用 
另 一 个 名 为 PUTCHAR 的 子 程序 来 显示 单个 字符 。 地 址 INSTATUS 通 过 寄存 器 R1 来 传送 给 
GETCHAR ， 主 程序 利用 寄存 器 R3 来 获取 所 需要 的 字符 。 地 址 OUTSTATUS 和 要 显示 的 字 
符 分 别 通 过 寄存 器 R2 和 R3 传 送 给 PUTCHAR。 子 程序 中 使 用 的 其 他 寄存 器 必须 通过 堆栈 来 
保存 和 恢复 ， 堆 栈 的 指针 是 寄存 器 R13。 在 主 程序 中 完成 字符 在 内 存 中 的 排序 以 及 查找 行 
尾 字 符 CR 的 工作 。 

采用 堆栈 来 传送 参数 ， 解 答 习 题 3.14。 

编写 一 个 从 键盘 接收 三 个 十 进 制 数 的 ARM 程 序 。 每 个 数 用 ASCII 码 (参见 附录 E) 表示 。 假 
设 这 三 个 十 进 制 数 表 示 的 范围 在 0 到 999 的 十 进 制 整数 之 中 ， 将 该 整数 转换 成 一 个 二 进 制 数 
表示 形式 ， 并 首先 接受 数 的 高 位 部 分 。 为 了 简便 起 见 ， 在 内 存 中 保存 两 张 字 表 ， 每 张 表 中 
有 10 项 内 容 。 第 一 张 表 的 起 始 位 置 是 TENS， 其 内 容 是 十 进 制 数 0, 10, 20, …, 90 的 二 进 制 表 
示 形 式 。 第 二 张 表 的 起 始 位 置 是 HUNDREDS， 其 内 容 是 十 进 制 数 0, 100, 200, …, 900 的 二 进 
制 表示 形式 。 

对 习题 3.16 中 的 十 进 制 到 二 进 制 转换 程序 使 用 两 个 嵌 套 的 子 程序 来 实现 。 调 用 第 一 个 子 程 
序 的 主 程序 通过 将 两 个 参数 压 人 堆栈 (指针 寄存 器 是 R13) 来 传送 参数 。 第 一 个 参数 是 用 
来 保存 输入 的 十 进 制 数字 字符 的 一 个 3 字 节 内 存 缓冲 区 的 地 址 。 第 二 个 参数 是 转换 后 的 二 
进 制 数 的 保存 单元 的 地 址 。 第 一 个 子 程序 从 键盘 读 取 三 个 字符 ， 然 后 调用 第 二 个 子 程序 进 
行 转换 。 该 子 程序 所 需 参 数 是 通过 处 理 器 中 的 寄存 器 进行 传送 的 。 两 个 子 程序 必须 在 堆栈 
中 保存 它们 使 用 的 任何 寄存 器 的 内 容 。 

(a) 为 ARM 处 理 器 编写 这 两 个 子 程序 。 

(b) 给 出 第 二 个 子 程序 调用 指令 执行 完成 时 堆栈 的 内 容 。 

考虑 习题 2.18 中 描述 的 队列 结构 。 编 写 一 个 在 处 理 器 寄存 器 和 队列 之 间 传送 数据 的 ARM 
APPEND 和 REMOVE 程序 。 要 注意 检查 和 更 新 队列 的 状态 以 及 每 次 试图 执行 一 个 操作 的 指 
针 情 况 。 

利用 习题 3.5 中 描述 的 结果 表示 格式 ， 对 图 3-15b 中 的 字 节 排序 程序 编写 一 个 跟踪 程序 。 在 
程序 中 最 后 一 条 指令 每 次 执行 之 后 ， 给 出 寄存 器 RO、R2 和 R3 的 内 容 和 位 于 LIST, LIST+1,…， 
LIST + 4 的 5 字 节 列表 的 内 容 。 假 设 LIST=1000， 列 表 的 初始 值 是 120、13、106、45 及 67， 
其 中 [ LIST ] = 120。 

用 一 个 子 程序 重 写 图 3-15b 中 的 字 节 排序 程序 ， 对 32 位 的 正 整数 列表 进行 排序 。 调 用 程序 将 
列表 地 址 传送 给 子 程序 。 在 该 位 置 处 的 第 一 个 32 位 数 是 列表 项 的 数目 ， 之 后 紧 跟着 的 就 是 
要 排序 的 数字 。 

考虑 图 3-15b 的 字 节 排序 程序 。 在 每 次 遍历 子 列表 期 间 ， 即 从 LIST U ) 到 LIST ( 0 )， 只 要 是 
LIST (k ) > LIST (j) 就 将 表 项 交换 。 另 一 种 策略 是 保持 子 列表 中 最 大 值 的 地 址 ， 在 子 列表 
查找 的 末尾 处 进行 一 次 对 换 。 利 用 这 种 方法 重 写 程 序 。 这 种 方法 有 何 优点 ? 

假设 图 2-14 所 示 的 学 生 测 试 成 绩 列 表 保 存在 内 存 的 一 个 链表 (如 图 2-36 所 示 ) 中 。 编 写 一 
个 与 图 2-15 程 序 具 有 相同 功能 的 ARM 程 序 。 头 记录 保存 在 内 存 的 1000 处 。 

图 3-16 中 的 链表 播 人 子 程序 并 没有 检查 是 否 在 链表 中 存在 与 新 记录 相同 的 记录 。 如 果 在 链 
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表 中 存在 这 样 的 记录 ， 执 行 子 程序 会 如 何 呢 ? 修改 这 个 子 程序 ， 使 之 在 找到 匹配 的 记录 时 
将 该 记录 的 地 址 存 和 寄存 器 Ri10 中 并 返回 ， 如 果 插 入 成 功 返 回 0。 

3.24 在 图 3-17 中 的 链表 删除 子 程序 中 ， 假 设 列 表 中 存在 有 寄存 器 RIDNUM 所 包含 的 ID 记录 。 如 
果 这 个 灵 的 记录 在 链表 中 不 存在 ， 热 行 子 程序 将 会 如 何 ? 修改 这 个 子 程序 ， 如 果 删 除 成 功 ， 
用 RIDNUM 返 回 0， 如 果 该 记录 在 链表 中 不 存在 ， 就 保持 RIDNUM 不 变 。 


部 分 1 68000 


3.25 考虑 以 下 68000 处 理 器 的 状态 : 
寄存 器 D0 的 内 容 是 $1000; 
寄存 器 A0 的 内 容 是 $2000; 
寄存 器 A1 的 内 容 是 $1000; 
内 存单 元 $1000 处 保存 一 个 长 字 $2000; 
内 存单 元 $2000 处 保存 一 个 长 字 $3000; 
如 果 下 面 的 三 条 指令 每 次 都 是 以 这 个 初始 状态 开始 ， 那 么 每 条 指令 执行 完 的 结果 如 何 ? 每 
条 指令 要 占用 多 少 字 节 ? 每 条 指令 读 取 和 执行 的 过 程 中 需要 访问 多 少 次 内 存 ? 
(a) ADD.L DO, (A0) 
(b) ADD.L. (A1,D0), D0 
(c) ADD.L #$2000, (A0) 
3.26 从 下 面 的 68000 指 令 中 找 出 语法 错误 : 
(a) ADDX -(A2,D3 
(b) LSRL #9,D2 
(c) MOVE.B 520(A2, D2) 
(d) SUBA.L 12(A2, PC), A0 
(e) CMPB #254, $12(A2, D1.B) 
3.27 程序 跟踪 是 在 一 个 程序 执行 期 间 某 个 特定 的 寄存 器 和 内 存 位 置 处 在 不 同时 刻 的 内 容 列表 。 
在 ADD.W 指 令 每 次 执行 完 以 及 图 3-25 程 序 中 最 后 的 MOVE.L 指 令 执行 完 之 后 ， 列 出 寄存 器 
DO、D1 和 A2 以 及 内 存单 元 N、NUM1 和 SUM 中 的 内 容 。 以 表格 的 形式 给 出 结果 ， 表 格 中 以 
寄存 器 和 内 存单 元 作为 列 的 头 部 。 使 用 六 行将 每 条 指令 执行 完 之 后 的 寄存 器 和 内 存 的 内 容 
列 出 来 。 假 定 有 下 面 的 初始 值 ，[SUM]=0，[N]=5，NUM1=2400， 五 个 数 分 别 是 83、45、 
156、 一 250 和 100。 
3.28 考虑 下 面 的 68000 程 序 : 
MOVEAL MEMI, A0 
MOVEA.L MEM2, A2 
ADDA.L A0, Al 
MOVEA.L A0,A2 
MOVE.B (A0) + , DO 
LOOP CMPB (A0) +, DO 
BLE NXT 
LEA - 1(A0), A2 
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MOVE.B (A2), D0 
NXT CMPAL A0, Al 
BGT LOOP 


MOVE.L A2, DESIRED 
(a) 这 个 程序 的 功能 是 什么 ? 
(b) 将 这 个 程序 保存 到 内 存 中 需要 多 少 16 位 的 字 ? 
(c) 给 出 访问 内 存 所 需 次 数 的 表达 式 。 表 达 式 可 以 是 T= a + bn + cm 的 形式 ， 其 中 nn 是 循环 要 
执行 的 次 数 ，m 是 不 执行 到 NXT 处 转移 的 次 数 ，a, b 和 c 是 常量 。 
3.29 考虑 图 P3-1 中 的 两 个 68000 程 序 。 
(a) 这 两 个 程序 在 RSLT 处 的 值 相同 吗 ? 
(b) 它们 完成 的 任务 是 什么 ? 
(c) 在 内 存 中 保存 每 个 程序 各 需 多 少 字 节 ? 
(d) 哪 一 个 程序 对 内 存 的 访问 次 数 更 多 ? 
(e) 这 两 个 程序 的 优点 和 缺点 是 什么 ? 


#$FFFE,D0 
#LIST,A0 #LIST,A0 
(A0)+,D1 (AO)+ 


LOOP LOOP 

#1,D0 . #1,D0 
#17,D0 LOOP 

LOOP -2(A0),RSLT 
-2(A0),RSIT 





图 P3-1 习题 3.29 的 两 个 68000 程 序 


3.30 编写 一 个 68000 程 序 ， 对 两 个 字 节 列表 中 相应 的 字 节 进行 比较 并 将 较 大 字 节 的 列表 放 到 第 
三 个 表 中 。 两 个 列表 的 起 始 位 置 分 别 是 X 和 Y， 较 大 字 节 列表 的 起 始 位 置 是 LARGER。 列 表 
的 长 度 保存 在 内 存 中 N 单 元 处 。 

3.31 一 个 68000 程 序 具有 如 下 的 字符 操作 任务 : 一 个 具有 n 个 字符 的 字符 串 保存 在 内 存 中 以 
STRING 为 起 始 地 址 的 连续 字 节 单元 处 。 另 一 个 较 短 的 有 闫 个 字符 的 字符 串 保 存在 以 
SUBSTRING 为 起 始 地 址 的 连续 字 节 单元 处 。 该 程序 必须 从 STRING 单 元 处 保存 的 字符 串 开 
始 查找 ， 看 是 否 存在 一 个 与 SUBSTRING 单 元 保存 的 字符 串 相 匹配 的 连续 子 串 。 长 度 参数 n 
和 m (其 中 n > m) 分 别 保存 在 内 存 中 的 N 和 M 单 元 处 。 如 果 找 到 了 一 个 匹配 的 子 串 ， 将 它 
的 第 一 个 字 节 的 地 址 保存 在 寄存 器 RO 中 ; 否则 ，R0 的 内 容 将 被 清 0。 该 程序 不 必 判 断 子 串 
是 否 重复 出 现 。 这 里 只 需要 第 一 个 匹配 子 串 的 地 址 。 

3.32 编写 一 个 68000 程 序 ， 生 成 一 个 长 度 为 的 Fibonacci 数 列 。 数 列 中 的 前 两 个 数 为 0 和 1， 每 个 
数 等 于 前 面 两 个 数 之 和 。 例 如 ，n = 8 时 的 数列 为 

0, 1, 1, 2, 3, 5, 8, 13 
程序 应 该 在 以 MEMLOC 开 始 的 连续 内 存 字 中 保存 。 假 设 n 值 保存 在 单元 N 处 。 程 序 中 可 以 
处 理 的 最 大 n 值 是 多 少 ? 
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编写 一 个 68000 程 序 ， 将 一 个 单词 (文本 ) 的 全 部 小 写字 母 转换 成 大 写字 母 。 构 成 该 单词 
的 ASCII 字 符 保 存在 内 存 连 续 的 字 节 中 ， 它 的 起 始 位 置 为 WORD， 以 一 个 空格 为 最 后 结束 
(参见 附录 E 中 的 ASCIH 表 )。 

对 图 2-14 中 的 成 绩 表 修改 一 下 ， 使 每 个 学 生 有 j 门 测 验 成 绩 。 假 设 有 7 个 学 生 。 编 写 一 个 
68000 程 序 用 于 计算 每 门 测验 的 总 分 数 并 将 这 些 总 分 数 保 存 到 内 存 地 址 为 SUM, SUM+4， 
SUM+8, … 的 字 中 。 测 验 的 数目 j 要 大 于 处 理 器 中 寄存 器 的 数量 ， 所 以 在 图 2-15 中 给 出 的 用 
于 3 门 测验 情况 的 程序 类 型 是 不 能 使 用 的 。 建 议 使 用 在 2.5.3 节 中 介绍 的 两 个 碟 套 循环 。 内 部 
循环 用 于 累计 某 个 特定 的 测验 总 和 ， 外 部 循环 用 于 控制 测验 的 次 数 j/。 假设/ 保存 在 内 存 中 
单元 J 处 ， 该 单元 在 单元 N 的 前 面 。 

编写 一 个 68000 程 序 ， 从 键盘 读 取 "个 字符 ， 在 读 取 这 些 字符 时 将 它们 放 入 用 户 使 用 的 堆栈 
中 ， 之 后 将 这 些 字符 在 显示 器 上 显示 出 来 。 使 用 寄存 器 A0 作 为 堆栈 指针 。 字 符 个 数 z 保 存 
在 内 存 的 单元 N 处 。 

假设 在 图 3-27 程 序 中 的 一 条 指令 从 取出 到 执行 所 用 的 平均 时 间 是 20 纳 秒 。 如 果 每 秒 钟 键盘 
的 按键 次 数 是 10， 那 么 每 输入 一 个 字符 时 ，BEQ READ 指 令 大 概 执行 多 少 次 ? 假设 每 个 字 
符 的 显示 时 间 要 远 远 小 于 键盘 上 连续 输入 两 个 字符 的 时 间 。 

在 图 3-27 的 68000 程 序 中 ，“in-line” 代 码 的 功能 读 取 一 行 字符 并 将 它们 显示 出 来 。 重 新 编写 
该 程序 ， 采 用 主 程序 调用 名 为 GETCHAR 的 子 程序 来 读 取 一 个 字符 ， 然 后 再 调用 另 一 个 名 
为 PUTCHAR 的 子 程序 来 显示 单个 字符 。 地 址 INSTATUS 和 DATAIN 通 过 寄存 器 A0 和 Al 来 传 
送 给 GETCHAR ， 主 程序 利用 寄存 器 D0 来 获取 所 要 的 字符 。 地 址 OUTSTATUS 与 DATAOUT 


和 要 显示 的 字符 分 别 通过 寄存 器 A2、A3 和 D0 传送 给 PUTCHAR。 子 程序 中 使 用 的 其 他 寄存 


器 必须 由 子 程序 通过 堆栈 进行 保存 和 恢复 ， 堆 栈 的 指针 是 寄存 器 A7。 在 主 程序 中 完成 字符 
在 内 存 中 的 排序 以 及 短 找 行 尾 字符 CR 的 工作 。 

采用 堆栈 传送 参数 的 方法 重新 回答 3.37 的 问题 。 

考虑 习题 2.18 中 描述 的 队列 结构 。 编 写 一 个 在 处 理 器 寄存 器 和 队列 之 间 传 送 数据 的 68000 
APPEND 和 REMOVE 程序 。 要 注意 检查 和 更 新 队列 的 状态 以 及 每 次 试图 执行 一 个 操作 的 指 
针 情 况 。 

编写 一 个 从 键盘 接收 三 个 十 进 制 数 的 68000 程 序 。 每 个 数 用 ASCH 码 (参见 附录 E) 表示 。 假 
设 这 三 个 十 进 制 数 表示 一 个 范围 在 0 到 999 的 十 进 制 整数 ， 将 该 整数 转换 成 一 个 二 进 制 形 式 
表示 的 数 。 首 先 接受 数 的 高 位 部 分 。 为 了 简便 起 见 ， 在 内 存 中 保存 两 张 字 表 。 每 张 表 中 有 
10 项 内 容 。 第 一 张 表 的 起 始 位 置 是 TENS ， 其 内 容 是 十 进 制 数 0, 10, 20, …, 90 的 二 进 制 表示 形 
式 。 第 二 张 表 的 起 始 位 置 是 HUNDREDS， 其 内 容 是 十 进 制 数 0, 100, 200, …, 900 的 二 进 制 表 
对 习题 3.40 中 的 十 进 制 到 二 进 制 转换 程序 使 用 两 个 嵌 套 子 程序 来 实现 。 调 用 第 一 个 子 程序 
的 主 程序 通过 将 两 个 参数 压 人 堆栈 (指针 寄存 器 是 R13) 来 传送 参数 。 第 一 个 参数 是 用 来 
保存 输入 的 十 进 制 数字 字符 的 一 个 3 字 节 内 存 缓冲 区 的 地 址 。 第 二 个 参数 是 转换 后 的 二 进 
制 值 保 存 位 置 的 地 址 。 第 一 个 子 程序 从 键盘 读 取 三 个 字符 ， 之 后 调用 第 二 个 子 程序 来 进行 
转换 。 该 子 程序 所 需 的 参数 是 通过 处 理 器 寄存 器 来 传送 的 。 两 个 子 程序 必须 在 堆栈 中 保存 
它们 使 用 的 任何 寄存 器 的 内 容 。 

(a) 为 68000 处 理 器 编写 两 个 子 程序 。 
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(b) 给 出 第 二 个 子 程序 调用 指令 执行 完 时 处 理 器 堆栈 中 的 内 容 。 
考虑 一 个 16 位 的 数组 A (i, 站， 它 的 行 变 址 从 i = 0 到 n - 1， 列 变 址 从 六 = 0 到 m - 1。 该 数组 在 
68000 计 算 机 上 采用 按 行 存储 ， 每 行 元 素 占 用 mm 个 连续 的 字 。 编 写 一 个 用 于 将 列 x 和 列 y 按 对 
应 的 元 素 相 加 ， 并 将 相 加 的 和 保存 在 列 y? 中 的 68000 子 程序 。 变 址 x 和 ?是 通过 寄存 器 D1 和 D2 
传送 给 子 程序 的 。 参 数 n 和 m 通 过 寄存 器 D3 和 D4 传送 给 子 程序 ， 元 素 A (0,0) 的 地 址 是 用 
寄存 器 A0 来 传送 。 可 以 使 用 在 表 3-2 中 所 列 出 的 寻 址 方式 。 

编写 一 个 68000 程 序 ， 将 寄存 器 D2 中 的 位 序 进行 翻转 。 例 如 ， 如 果 D2 的 最 初 形式 是 1110… 
0100， 那 么 在 D2 中 的 结果 就 应 该 是 0010…0111。( 提 示 : 使 用 移 位 和 循环 移 位 操作 。) 

将 图 3-32 中 的 程序 保存 到 内 存 中 需要 多 少 字 节 ? 在 程序 的 执行 期 间 ， 需 要 进行 多 少 次 内 存 
访问 ? 

利用 习题 3.27 中 描述 的 结果 表示 格式 ， 对 图 3-34b 中 的 字 节 排序 程序 编写 一 个 跟踪 程序 。 在 
程序 中 最 后 一 条 指令 每 次 执行 之 后 ， 给 出 寄存 器 RO、R2 和 R3 的 内 容 和 位 于 LIST, LIST+1,…， 
LIST+4 的 5 字 节 列表 中 的 内 容 。 假 设 LIST=1000，、 列 表 的 初始 值 是 120、13、106、 45 及 67， 
其 中 [LIST]=120。 

用 一 个 子 程序 重 写 图 3-34b 中 的 字 节 排序 程序 ， 对 16 位 的 正 整数 列表 进行 排序 。 调 用 程序 将 
列表 地 址 传送 给 子 程序 。 在 该 位 置 处 的 第 一 个 16 位 数 是 列表 项 的 个 数 ， 之 后 紧 跟着 的 就 是 
要 排序 的 数字 。 

考虑 图 3-34b 的 字 节 排序 程序 。 在 每 次 遍历 子 列表 期 间 ， 即 从 LIST (j) 到 LIST ( 0 )， 只 要 是 
LIST ( k) >LIST (j) 就 将 表 项 交换 。 另 一 种 策略 是 保持 子 列表 中 最 大 值 的 地 址 ， 在 子 列表 
查找 的 末尾 处 进行 一 次 对 换 。 利 用 这 种 方法 重 写 程序 。 这 种 方法 有 何 优点 ? 

假设 图 2-14 所 示 的 学 生 测试 成 绩 列 表 保 存在 内 存 的 一 个 链表 (如 图 2-36 所 示 ) 中 。 编 写 一 
个 与 图 2-15 程 序 具 有 相同 功能 的 68000 程 序 。 头 记录 保存 在 内 存 的 1000 处 。 假 定 全 部 的 表 项 
都 采用 长 字 。 

图 3-35 中 的 链表 插入 子 程序 并 没有 检查 是 否 在 链表 中 存在 与 新 记录 相同 的 记录 。 如 果 在 链 
表 中 存在 这 样 的 记录 ， 执 行 子 程序 将 如 何 做 ? 修改 这 个 子 程序 ， 使 之 在 找到 匹配 的 记录 时 
将 该 记录 的 地 址 存 入 寄存 器 A6 中 并 返回 ， 如 果 播 入 成 功 则 返回 0。 

在 图 3-36 的 链表 删除 子 程序 中 ， 假 设 列表 中 存在 有 寄存 器 RIDNUM 所 包含 的 ID 记录 。 如 果 
这 个 ID 记 录 在 链表 中 不 存在 ， 执 行 子 程序 将 如 何 ? 修改 这 个 子 程序 ， 如 果 删 除 成 功 ， 用 
RIDNUM 返 回 0; 如 果 该 记录 在 链表 中 不 存在 ， 就 保持 RIDNUM 不 变 。 
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假设 IA-32 计 算 机 中 的 寄存 器 和 内 存 的 内 容 如 下 : 

寄存 器 EBX 的 内 容 是 1000; 

寄存 器 ESI 的 内 容 是 2; 

数值 1, 2, 3, 4, 5 和 6 保存 在 内 存 从 1000 开 始 的 连续 双 字 单元 处 ; 

地 址 标号 LOC 代 表 地 址 1008; 

如 果 下 面 的 三 条 指令 每 次 都 是 以 这 种 初始 状态 开始 的 ， 那 么 每 条 指令 执行 完 的 结果 如 何 ? 
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每 条 指令 要 占用 多 少 个 字 节 ? 
(a) MOV EAX,10 
ADD EAX, [ EBX + ESI*4 + 8 ] 
(@)PUSH 20 
PUSH 30 
POP EAX 
POP EBX 
SUB EAX, EBX 
(c) LEA EAX, LOC 


MOV EBX, [EAX] 
下 面 的 IA-32 指 令 中 哪个 会 使 汇编 程序 产生 语法 错误 信息 ? 为 什么 ? 
(a) ADD EAX, EAX 


(b) ADD [EAX], [EBX+4] 

(c) SUB EAX, [EBX+ESI*4 +20] 
(d) SUB EAX, [EBX+ESI*10] 
(e) ADD EAX, — 31728542 


(© MOV 20, EAX 

. (g) MOV EAX, [EBP+ESP+4] 
程序 跟踪 是 在 一 个 程序 执行 期 间 对 某 个 特定 的 寄存 器 和 内 存单 元 在 不 同时 刻 内容 的 列表 。 
列 出 在 图 3-40b 程 序 的 循环 指令 的 前 三 条 指令 每 次 执行 之 后 ， 寄 存 器 EAX、EBX 和 ECX 中 的 
内 容 。 用 表格 的 形式 给 出 结果 ， 表 格 以 三 个 寄存 器 作为 列 头 。 用 三 行列 出 在 循环 指令 每 次 
执行 完 之 后 寄存 器 中 的 内 容 。 程 序数 据 在 图 3-42 给 出 。 
编写 一 个 IA-32 程 序 ， 对 两 个 字 节 列表 中 的 相应 字 节 进行 比较 并 将 较 大 字 节 的 列表 放 到 第 三 
个 表 中 。 两 个 列表 的 起 始 位 置 分 别 是 X 和 Y， 较 大 字 节 列表 的 起 始 位 置 是 LARGER。 列 表 的 
长 度 保存 在 内 存单 元 N 处 。 
一 个 IA-32 程 序 具有 如 下 的 字符 操作 任务 : 一 个 具有 n 个 字符 的 字符 串 保 存在 内 存 以 STRING 
为 起 始 地 址 的 连续 字 节 单元 处 。 另 一 个 较 短 的 有 m 个 字符 的 字符 串 保存 在 以 SUBSTRING 为 
起 始 地 址 的 连续 字 节 单元 处 。 该 程序 必须 在 以 STRING 单 元 开始 的 字符 串 中 进行 查找 ， 查 
看 是 否 存在 一 个 与 SUBSTRING 处 保存 的 字符 串 相 匹配 的 连续 子 串 。 长 度 参 数 z 负 bm (其 中 
> m) 分 别 保存 在 内 存 中 的 N 和 M 单 元 处 。 如 果 找 到 了 一 个 匹配 的 子 串 ， 将 它 的 第 一 个 字 节 
地 址 保存 在 寄存 器 RO 中 ; 否则 ，R0 的 内 容 将 被 请 0。 该 程序 不 必 判 断 子 串 是 否 重 复出 现 。 
这 里 只 需要 第 一 个 匹配 子 串 的 地 址 。 
编写 一 个 IA-32 程 序 ， 生 成 一 个 长 度 为 nm 的 Fibonacci 数 列 。 数 列 中 的 前 两 个 数 为 0 和 1， 每 个 
数 等 于 前 面 两 个 数 之 和 。 例 如 ，n = 8 时 的 数列 为 

0, 1, 1, 2, 3, 5, 8, 13 

程序 应 该 保存 在 以 MEMLOC 开 始 的 连续 内 存 字 中 。 假 设 n 值 保存 在 单元 N 处 。 
编写 一 个 IA-32 程 序 ， 将 一 个 单词 (文本 ) 的 全 部 小 写字 母 转 换 成 大 写字 母 。 构 成 该 单词 的 
ASCII 字 符 保存 在 内 存 连 续 的 字 节 中 ， 它 的 起 始 位 置 为 WORD， 以 一 个 空格 为 最 后 结束 。 
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(参见 附录 E 中 的 ASCI 表 .。 ) 

对 图 2-14 中 的 成 绩 表 做 一 些 修改 ， 使 每 个 学 生 有 j 门 测验 成 绩 。 假 设 有 n 个 学 生 。 编 写 一 个 
IA-32 程 序 用 于 计算 每 门 测验 的 总 分 数 并 将 这 些 总 分 数 保存 到 内 存 地 址 SUM, SUM+4， 
SUM+8, … 的 字 中 。 测 验 的 数目 /要 大 于 处 理 器 中 寄存 器 的 数量 ， 所 以 在 图 2-15 中 给 出 的 用 
于 3 门 测验 情况 的 程序 类 型 是 不 能 使 用 的 。 建 议 使 用 在 2.5.3 节 中 介绍 的 两 个 修 套 循环 。 内 部 
循环 用 于 累计 某 个 特定 的 测验 总 和 ， 外 部 循环 用 于 控制 测验 次 数 /。 假设 7 保存 在 内 存单 元 J 
处 ， 该 单元 在 单元 N 的 前 面 。 

编写 一 个 IA-32 程 序 ， 将 寄存 器 EAX 中 的 位 序 进行 翻转 。 例 如 ， 如 果 EAX 的 最 初 形式 是 
1110…0100， 那 么 在 EAX 中 的 结果 就 应 该 是 0010…0111。( 提示: 使 用 移 位 和 循环 移 位 操作 。) 
考虑 习题 2.18 中 描述 的 队列 结构 。 编 写 一 个 在 处 理 器 寄存 器 和 队列 之 间 传 送 数 据 的 IA-32 
APPEND 和 REMOVE 程序 。 要 注意 检查 和 更 新 队列 的 状态 以 及 每 次 试图 执行 一 个 操作 的 指 
针 情 况 。 

编写 一 个 IA-32 程 序 ， 从 键盘 读 取 n 个 字符 ， 在 读 取 这 些 字符 时 将 它们 放 入 用 户 使 用 的 堆栈 
中 ， 之 后 将 这 些 字符 在 显示 器 上 显示 出 来 。 使 用 寄存 器 EBX 作 为 堆栈 指针 。 字 符 个 数 n 保 
存在 内 存单 元 N 处 。 

假设 图 3-44 程 序 中 的 一 条 指令 从 取出 到 执行 所 用 的 平均 时 间 是 20 纳 秒 。 如 果 每 秒 钟 键盘 的 
按键 次 数 是 10， 那 么 每 输入 一 个 字符 时 ，JNC READ 指 令 大 概 执行 多 少 次 ?假设 每 个 字符 
的 显示 时 间 要 远 远 小 于 键盘 上 连续 输入 两 个 字符 的 时 间 。 

在 图 3-44 中 的 IA-32 程 序 中 ,“in-line” 代 码 的 功能 是 读 取 一 行 字符 并 将 它们 显示 出 来 。 重 新 
编写 该 程序 ， 采 用 主 程序 调用 名 为 GETCHAR 的 子 程序 来 读 取 一 个 字符 ， 然 后 再 调用 另 一 
个 名 为 PUTCHAR 的 子 程序 来 显示 单个 字符 。 地 址 INSTATUS 和 DATAIN 通 过 寄存 器 EBX 和 
EDX 来 传送 给 GETCHAR ， 主 程序 利用 寄存 器 AL 来 获取 所 要 的 字符 。 地 址 OUTSTATUS 与 
DAIAOUT 和 要 显示 的 字符 分 别 通过 寄存 器 ESI、EDI 和 AL 传送 给 PUTCHAR。 子 程序 中 使 
用 的 其 他 寄存 器 必须 由 子 程序 通过 堆栈 来 保存 和 恢复 ， 堆 栈 的 指针 是 寄存 器 ESP。 在 主 程 
序 中 完成 对 字符 在 内 存 中 的 排序 以 及 查找 行 尾 字符 CR 的 工作 。 

采用 堆栈 传送 参数 的 方法 重新 回答 3.63 的 问题 。 

编写 一 个 从 键盘 接收 三 个 十 进 制 数 的 IA-32 程 序 。 每 个 数 用 ASCII 码 (参见 附录 E) 表示 。 
假设 这 三 个 十 进 制 数 表示 一 个 范围 在 0 到 999 的 十 进 制 整数 ， 将 该 整数 转换 成 一 个 二 进 制 形 
式 表 示 的 数 。 首 先 接受 数 的 高 位 部 分 。 为 了 简便 起 见 ， 在 内 存 中 保存 两 张 字 表 。 每 张 表 中 
有 10 项 内 容 。 第 一 张 表 的 起 始 位 置 是 TENS， 其 内 容 是 十 进 制 数 0, 10, 20, …, 90 的 二 进 制 表 
示 形 式 。 第 二 张 表 的 起 始 位 置 是 HUNDREDS， 其 内 容 是 十 进 制 数 0, 100, 200, …, 900 的 二 进 
制 表 示 形 式 。 

对 习题 3.65 中 的 十 进 制 到 二 进 制 转换 程序 使 用 两 个 局 套子 程序 来 实现 。 调 用 第 一 个 子 程序 
的 主 程序 通过 将 两 个 参数 压 入 堆栈 (指针 寄存 器 是 R13) 来 传送 参数 。 第 一 个 参数 用 来 保 
存 输入 的 十 进 制 数字 字符 的 一 个 3 字 节 内 存 缓冲 区 的 地 址 。 第 二 个 参数 是 转换 后 的 二 进 制 
值 的 保存 单元 地 址 。 第 一 个 子 程序 从 键盘 读 取 三 个 字符 ， 之 后 调用 第 二 个 子 程序 进行 转换 。 
该 子 程序 所 需 的 参数 是 通过 处 理 器 寄存 器 来 传送 的 。 两 个 子 程序 必须 在 堆栈 中 保存 它们 使 
用 的 任何 寄存 器 的 内 容 。 
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(a) 为 IA-32 处 理 器 编写 两 个 子 程序 。 
(b) 给 出 第 二 个 子 程序 调用 指令 执行 完 时 的 处 理 器 堆栈 中 的 内 容 。 

3.67 考虑 一 个 数值 数组 AG, 刀 ， 它 的 行 变 址 从 ; = 0 到 n - 1， 列 变 址 从 i = 0 到 m 1。 该 数组 在 IA- 
32 计 算 机 上 采用 按 行 存储 ， 每 行 元 素 占 用 m 个 连续 的 字 。 编 写 一 个 用 于 将 列 x 和 列 y 按 对 应 
的 元 素 相 如， 并 将 相 加 的 和 保存 在 列 y 中 的 IA-32 子 程序 。 变 址 x 和 y 是 通过 寄存 器 ESI 和 EDI 
传送 给 子 程序 的 。 参 数 x 和 mm 通过 寄存 器 EAX 和 EBX 传 送 给 子 程序 ， 元 素 A(0, 0) 的 地 址 是 用 
寄存 器 EDX 进 行 传送 的 。 可 以 使 用 在 表 3-3 中 所 列 出 的 寻 址 方式 。 

3.68 利用 习题 3.53 中 描述 的 结果 表示 格式 ， 对 图 3-50b 中 的 字 节 排序 程序 编写 一 个 跟踪 程序 。 在 
程序 中 每 当 最 后 一 条 指令 执行 之 后 ， 给 出 寄存 器 EDI、ECX 和 DL 中 的 内 容 和 位 于 LIST, 
LIST+1,…,LIST+4 处 的 5 字 节 列表 内 容 。 假 设 LIST=1000， 列 表 的 初始 值 是 120、13、106、 
45 及 67， 其 中 [LIST]=120。 f 

3.69 用 一 个 子 程序 重 写 图 3-50b 中 的 字 节 排序 程序 ， 对 32 位 的 正 整 数列 表 进 行 排序 。 调 用 程序 将 
列表 地 址 传送 给 子 程序 。 在 该 单元 处 的 第 一 个 32 位 数 是 列表 项 的 个 数 ， 之 后 紧 跟 着 的 就 是 
要 排序 的 数字 。 

3.70 考虑 图 3-50b 的 字 节 排序 程序 。 在 每 次 遍历 子 列表 期 间 ， 即 从 LIST (j) 到 LIST (0 )， 只 要 是 
LIST (上 )>LIST (j) 就 将 表 项 交换 。 另 一 种 策略 是 保持 子 列表 中 最 大 值 的 地 址 ， 在 子 列表 
查找 的 末尾 处 进行 一 次 对 换 。 利 用 这 种 方法 重 写 程序 。 这 种 方法 有 何 优点 ? 

3.71 假设 图 2-14 所 示 的 学 生 测 试 成 绩 列 表 保 存在 内 存 的 一 个 链表 〈 如 图 2-36 所 示 ) 中 。 编 写 一 
个 与 图 2-15 程 序 具 有 相同 功能 的 IA-32 程 序 。 头 记录 保存 在 内 存 的 1000 处 。 假 定 全 部 表 项 都 
采用 长 字形 式 。 

3.72 图 3-51 中 的 链表 插入 子 程序 并 没有 检查 是 否 在 链表 中 存在 与 新 记录 相同 的 记录 。 如 果 在 链 
表 中 存在 这 样 的 记录 ， 执 行 子 程序 将 如 何 做 呢 ? 修改 这 个 子 程序 ， 使 之 在 找到 匹配 的 记录 
时 将 该 记录 的 地 址 存 人 寄存 器 EDX 中 并 返回 ， 如 果 插 入 成 功 则 返回 0。 

3.73 在 图 3-52 的 链表 删除 子 程序 中 ， 假 设 列表 中 存在 有 寄存 器 RIDNUM 所 包含 的 ID 记 录 。 如 果 
这 个 ID 的 记录 在 链表 中 不 存在 ， 执 行 子 程序 将 如 何 做 ? 修改 这 个 子 程序 ， 如 果 删 除 成 功 ， 
用 RIDNUM 返 回 0; 如 果 该 记录 在 链表 中 不 存在 ， 就 保持 RIDNUM 不 变 。 
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第 4 章 


输入 输出 组 织 结构 


本 章 目标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

* 如何 使 用 轮 询 方式 执行 程序 来 控制 /O 

。 中 汤 的 概念 以 及 支持 中 断 的 硬件 和 软件 

。 高 速 设备 中 直接 存储 器 访问 的 VO 机 制 

。 通 过 同步 和 异步 总 线 的 数据 传送 

“IO 接口 电路 的 设计 

。 在 特定 的 PCI、SCSI 和 USB 总 线 中 的 商用 总 线 标准 


计算 机 的 一 个 基本 特性 是 具有 与 其 他 设备 交换 信息 的 能 力 。 这 一 通信 和 能力 使 操作 员 可 以 完 
成 很 多 操作 ， 例 如 用 键盘 和 显示 屏幕 来 处 理 文本 和 图 形 。 实 际 中 ,我 们 广泛 地 使 用 计算 机 通过 
Intemet 与 其 他 计算 机 通信 并 访问 全 球 信息 。 此 外 ， 在 其 他 应 用 中 ， 计 算 机 虽然 不 是 很 直观 ， 但 
仍 有 着 同等 重要 的 作用 。 它 们 是 家 用 电器 、 制 造 设 备 、 运 输 系 统 、 银 行 和 销售 点 终端 的 集成 部 
分 。 在 这 些 应 用 中 ， 计 算 机 的 输入 可 能 来 自传 感 器 开关 、 数 字 照 相机 、 麦 克 风 或 火 称 报效 器 ; 
输出 可 能 是 发 送 给 扬声器 的 声音 信号 或 用 来 改变 发 动机 速度 、 打 开 阅 门 或 使 机 器 人 按 指定 方式 
传送 的 数字 编码 指令 。 简 而 言 之 ， 计 算 机 总 的 目标 是 能 在 不 同 环境 下 与 多 种 设备 交换 信息 。 

在 本 章 中 ， 我 们 将 详细 分 析 执 行 WO 操 作 的 各 种 不 同方 法 。 首 先 讨论 程序 员 遇 到 的 一 些 问题 ， 
然后 讨论 与 总 线 、VWO 接 口 有 关 的 硬件 细节 ， 并 介绍 一 些 通用 的 总 线 标准 。 


4.1 访问 /OO 设备 


最 简单 的 就 是 使 用 单 总 线 方案 将 MO 设备 连接 到 计算 机 上 ， 如 图 4-1 所 示 。 这 根 总 线 使 所 有 与 
它 相连 的 设备 可 以 交换 信息 。 通 常 由 三 种 传输 
线 组 成 ， 分 别 用 来 传输 地 址 、 数 据 和 控制 信号 。 
每 台 设 备 都 分 配 一 个 惟一 的 地 址 空间 。 当 处 理 
器 将 特定 的 地 址 放置 到 地 址 线 上 时 ， 识 别 出 这 。 & 红 
个 地 址 的 设备 就 响应 控制 线 上 的 命令 。 处 理 器 
进行 读 或 写 请 求 ， 请 求 的 数据 由 数据 线 传输 。 
就 像 我 们 在 2.7 节 中 所 到 的 ， 当 UO 设 备 与 存储 器 E 
共享 同一 个 地 址 空间 时 ， 这 种 方式 称 为 存储 器 图 4-1 单 总 线 结构 
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映射 TO (memory-mapped 1/0). 
具有 存储 器 映射 JO 时 ， 任 何 可 以 访问 存储 器 的 机 器 指令 也 都 可 以 用 来 与 WO 设备 进行 数据 传 
送 。 比 如 ， 如 果 DAIAIN 是 键盘 输入 缓冲 区 的 地 址 ， 指 令 
Move DATAIN, RO 


将 从 DATIAIN 中 读 取 数据 并 存储 到 寄存 器 RO 中 。 类 似 地 ， 指 令 
Move R0, DATAOUT 


将 寄存 器 RO 的 内 容 发 送 到 DATAOUT，DATAOUT 可 能 是 显示 单元 或 打印 机 的 输出 数据 缓冲 区 。 

大 部 分 计算 机 系统 采用 的 是 存储 器 映射 JO。 但 也 有 一 些 处 理 器 用 专门 的 输入 输出 指令 来 执 
行 WO 传输 。 例 如 ， 第 3 章 中 描述 的 Intel 系 列 处 理 器 就 有 专门 的 WO 指令 和 分 配给 1/O 设 备 的 独立 的 
16 位 地 址 空间 。 当 构建 一 个 基于 这 些 处 理 器 的 计算 机 系统 时 ， 设 计 者 可 以 有 两 种 方法 连接 W/O 设 
备 : 使 用 专门 的 VO 地 址 空间 或 简单 地 将 它们 作为 存储 器 地 址 空间 的 一 部 分 。 后 一 种 方法 目前 最 
常用 ， 因 为 它 可 以 使 软件 简化 。 独 立 1/O 地 址 空间 的 一 个 优点 是 :WO 设备 需要 处 理 的 地 址 线 少 。 
但 需要 注意 的 是 ， 独 立 的 地 址 空间 并 不 意味 着 MO 地 址 线 与 存储 器 地 址 线 在 物理 上 是 分 开 的 。 总 
线 上 有 一 个 专门 的 信号 用 来 表示 请 求 的 读 / 写 传输 是 否 为 IO 操作。 如 果 该 信号 被 置 位 ， 则 存储 器 
忽略 此 次 传输 的 请 求 。MO 设 备 检查 地 址 线 上 的 低位 ， 然 后 决定 是 否 应 该 响应 。 

图 4-2 说 明了 将 IO 设备 连接 到 总 线 上 所 需要 的 硬件 。 地 址 译 码 器 可 以 使 设备 在 地 址 线 上 识别 
出 自己 的 地 址 。 数 据 寄存 器 中 保存 正在 发 送 给 处 理 器 或 者 来 自 处 理 器 的 数据 。 状 态 寄存 器 包含 
有 关 I1O 设 备 的 操作 信息 。 数 据 和 状态 寄存 器 都 连接 到 数据 线 上 并 分 配 惟 一 的 地 址 。 控 制 电路 用 
来 协调 VO 传输 。 地 址 译 码 器 、 数 据 和 状态 寄存 器 以 及 控制 电路 构成 了 设备 的 接口 电路 。 


地 址 线 
总 线 | 数据 线 
控制 线 





图 4-2 输入 设备 的 MO 接口 


IO 设备 的 速度 与 处 理 器 的 速度 相差 非常 大 。 当 操作 者 从 键盘 输入 数据 时 ， 在 连续 的 两 次 输 
人 之 间 处 理 器 就 可 以 处 理 上 百 万 条 指令 。 只 有 当 键盘 接口 的 输入 缓冲 区 中 存在 有 效 字 符 时 ， 键 
盘 读 取 指 令 才 能 被 执行 。 同 时 还 必须 确保 每 个 字符 只 被 读 取 一 次 。 

在 2.7 节 中 我 们 介绍 了 输入 输出 操作 的 一 些 基本 概念 。 在 输入 输出 设备 中 ， 如 键盘 ， 状 态 标 
志 “SIN” 作 为 状态 寄存 器 的 一 部 分 包含 在 接口 电路 中 。 当 在 键盘 上 按 下 某 个 字符 时 ，SIN 被 置 
1， 当 处 理 器 读 取 该 字符 后 它 被 清 0。 因 此 ， 软 件 可 以 通过 检查 SIN 标 志 来 保证 每 次 读 取 的 都 是 
有 效 数据 。 通 常用 一 个 重复 读 取 状态 寄存 器 并 检查 SIN 状 态 的 循环 程序 来 执行 这 一 功能 。 当 SIN 
等 于 1 时 ， 程 序 读 取 输 入 数据 寄存 器 。 对 于 输出 操作 也 可 以 用 相似 的 程序 控制 ， 使 用 输出 状态 
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标志 SOUT。 


x 例 4.1 复习 一 下 基本 概念 ， 我 们 来 看 一 个 计算 机 系统 中 简单 的 IO 操 作 的 例子 ， 该 操作 涉及 
一 个 键盘 和 一 台 显示 器 。 图 4-3 中 所 示 的 4 个 寄存 器 用 于 数据 传输 操作 。 寄 存 器 STATUS 包括 两 个 
控制 标志 SIN 和 SOUT， 分 别 为 键盘 和 显示 器 提供 状态 信息 。 该 寄存 器 中 的 另外 两 个 标志 KIRQ 和 
DIRQ 与 中 断 协同 工作 。 这 两 个 标志 与 CONTROL 寄 存 器 中 的 KEN 和 DEN 位 将 在 4.2 节 中 讨论 。 从 
键盘 输入 的 数据 存储 在 DATAIN 寄 存 器 中 ， 发 送 给 显示 器 的 数据 存储 在 DATAOUT 寄 存 器 中 。 


DATAIN | 


DATAOUT | | 








图 4-3 键盘 和 显示 器 接口 中 的 寄存 器 


图 4-4 所 示 的 程序 与 图 2-20 所 示 的 程序 类 似 。 该 程序 从 键盘 读 和 人 一 行 字符 并 存储 到 从 LINE 位 
置 开 始 的 存储 器 缓冲 区 中 ， 然 后 调用 子 程序 PROCESS 对 输入 行进 行 处 理 。 每 读 取 一 个 字符 就 将 
它 回 显 (echoed back) 到 显示 器 上 。 寄 存 器 RO 用 作 存 储 器 缓冲 区 的 指针 。 由 于 RO 中 的 内 容 采 用 
自动 递增 寻 址 方式 更 新 ， 因 此 连续 的 字符 将 存储 在 连续 的 存储 器 区 域 中 。 


N 
° 
[oA 


TestBit 

Branch=0 一 个 字符 
Move 

TestBit #1,STATUS 

Branch=0 WAITD 


Move , 初始 化 存储 器 指针 
测试 SIN 


Move R1,DATAOUT 

Move RI1,(RO)+ 

Compare — #$OD,R1 检查 是 否 为 回 车 符 
Branch*0 WAITK 如 果 不 是 ， 得 到 另 一 字符 
Move #$0A,DATAOUT 否则 ， 发 送 换行 符 

Call PROCESS 调用 子 程序 处 理 输入 行 





图 4-4 从 键盘 读 人 一 行 字符 存储 到 存储 器 缓冲 区 ， 并 在 显示 器 上 回 显 的 程序 


对 每 个 字符 ， 都 要 检查 是 否 为 回 车 符 (CR )， 回 车 符 的 ASCII 码 值 为 0D (16 进 制 )。 如 果 是 ， 
那么 就 发 送 一 个 换行 符 〈ASCH 码 值 为 0A) 将 显示 器 上 的 光标 下 移 一 行 并 调用 子 程序 PROCESS， 
否则 ， 程 序 循环 等 待 下 一 个 输入 字符 。 


该 程序 阐明 了 程序 控制 WO 的 工作 方式 ， 这 里 处 理 器 通过 不 断 地 检查 状态 标志 来 实现 与 输入 
输出 设备 的 同步 ， 这 称 为 处 理 器 轮 询 设 备 。 此 外 ， 还 有 其 他 两 种 通用 的 IO 操作 方式 ， 中 断 和 直 
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接 存储 器 访问 。 在 中 断 方式 中 ， 当 LO 设备 准备 好 传输 操作 时 就 在 总 线 上 发 送 一 个 专门 的 信和 号， 
由 此 实现 同步 。 直 接 存储 器 访问 是 一 种 用 于 高 速 JO 设 备 的 技术 。 在 这 种 方式 中 ， 设 备 接口 与 主 
存 之 间 直 接 传输 数据 ， 不 再 需要 处 理 器 的 和 干预。 在 接 下 来 的 三 节 中 我 们 将 分 别 讲述 这 三 种 方式 ， 
然后 分 析 涉 及 到 的 硬件 ， 包 括 处 理 器 和 MO 设备 接口 。 


4.2 中 断 


在 图 4-4 的 例子 中 ， 当 程序 进入 等 待 循环 后 ， 不 停 地 重复 测试 设备 状态 。 这 期 间 ， 处 理 器 不 
进行 任何 有 效 的 计算 。 但 在 很 多 情况 下 ， 处 理 器 在 等 待 JO 设 备 就 绪 期 间 可 以 执行 其 他 的 任务 。 
为 此 ， 我 们 安排 MO 设备 在 准备 就 绪 时 主动 通知 处 理 器 ， 这 可 以 通过 发 送 硬件 中 断 信 号 给 处 理 器 
来 实现 。 在 这 种 方式 下 ， 至 少 需 要 一 条 专门 的 中 断 请 求 控制 线 。 既 然 处 理 器 不 再 需要 连续 检测 
外 部 设备 ， 便 可 以 利用 等 待 时 间 来 执行 其 他 任务 。 实 际 上 ， 通 过 使 用 中 断 可 以 很 理想 地 消除 这 
些 等 待 时 间 。 





例 4.2 ”让 我 们 来 看 一 项 任务 ， 它 首先 需要 进行 一 些 计算 ， 然 后 将 结果 在 行 式 打印 机 上 打印 
出 来 。 之 后 是 更 多 的 计算 和 输出 ， 如 此 继续 。 假 设 程序 包括 两 个 子 程序 : COMPUTE 和 PRINT， 
COMPUTE 产 生 n 行 输出 的 集合 ， 这 些 输 出 行将 由 PRINT 打 印 出 来 。 

这 一 任务 可 以 通过 先 执行 COMPUTE 程 序 ， 然 后 执行 PRINT 程 序 ， 如 此 重复 来 完成 。 由 于 打 
印 机 每 次 只 能 接收 一 行文 本 ， 因 此 PRINT 程 序 发 送 一 行文 本 后 ， 必 须 等 待 该 行 被 打印 出 来 以 后 
才能 发 送 另 一 行 ， 如 此 重复 直至 所 有 结果 都 被 打印 出 来 。 这 种 简单 方法 的 缺点 是 处 理 器 要 花费 
相当 多 的 时 间 等 待 打印 机 准备 就 绪 。 如 果 可 以 将 打印 和 计算 过 程 重合， 在 打印 过 程 中 执行 
COMPUTE 程 序 ， 那 么 总 的 执行 速度 就 会 快 得 多 。 可 以 按照 下 面 的 方法 实现 。 首 先 ， 执 行 
COMPUTE 程 序 产生 第 一 个 n 行 的 输出 ; 然后 执行 PRINT 程 序 发 送 第 一 行文 本 给 打印 机 。 此 时 ， 
我 们 不 等 待 该 行 被 打印 出 来 ,将 PRINT 程 序 暂时 中 断 转 去 执行 COMPUTE 程 序 ; 当 打 印 机 就 绪 后 ， 
发 送 一 个 “中 断 请 求 ”信号 通知 处 理 器 。 处 理 器 响应 后 ， 中 断 COMPUTE 程 序 并 将 控制 权 转 给 
PRINT 程 序 ; PRINT 程 序 将 第 二 行 发 送 给 打印 机 并 再 次 中 断 ， 接 着 被 中 断 的 COMPUTE 程 序 在 中 
断 点 处 重新 开始 执行 。 这 个 过 程 将 持续 下 去 直到 所 有 mx 行 都 被 打印 出 来 ，PRINT 程 序 结束 。 

在 下 一 个 “ 行 输出 准备 就 绪 时 ，PRINT 程 序 将 重新 启动 。 如 果 COMPUTE 产 生 z 行 输出 花费 的 
时 间 要 长 于 打印 的 时 间 ， 那 么 处 理 器 将 一 直 执行 有 效 的 计算 。 





这 个 例子 阐明 了 中 断 的 概念 。 响 应 中 断 请 求 时 执行 的 程序 称 为 中 断 服务 程序 ， 这 里 PRINT 程 
序 便 是 中 断 服务 程序 。 中 断 与 子 程序 调用 十 分 相似 。 假 设 在 执行 图 4-5 中 的 指令 i 时 有 一 个 中 断 
请 求 到 达 。 那 么 处 理 器 先 执行 完 指令 i， 然 后 将 中 断 服务 程序 的 第 一 条 指令 地 址 装 入 程序 计数 器 。 
这 里 ,我们 不 妨 假设 谈 地 址 就 在 处 理 器 中 。 执 行 完 中 断 服务 程序 后 ， 处 理 器 返回 到 指令 i + 1 处 。 
因此 ， 当 发 生 中 汤 请 求 时 ， 当 前 PC 的 内 容 指向 第 i + 1 条 指令 ， 并 被 暂时 保存 到 一 个 已 知 区 域 中 。 
在 中 断 服务 程序 结束 后 ， 中 断 返 回 指令 从 暂时 保存 区 域 取 出 保存 的 内 容 并 重新 装 入 到 PC 中 ， 处 
理 器 开始 在 第 i + 1 条 指令 处 接着 执行 。 许 多 处 理 器 的 返回 地 址 保存 在 堆栈 中 。 此 外 ， 返 回 地 址 还 
可 以 保存 在 一 个 专门 区 域 ， 比 如 专门 提供 的 寄存 器 中 。 

应 该 注意 的 是 ， 作 为 中 断 处 理 的 一 部 分 ， 处 理 器 必须 通知 设备 它 的 请 求 已 经 被 识别 ， 使 得 
该 设备 撤销 它 的 中 断 请 求 信号 。 这 可 以 由 总 线 上 的 专门 控制 信号 来 实现 。 在 后 面 将 要 讲述 的 中 
断 方式 中 使 用 的 中 断 确 认 信 号 就 是 用 来 实现 这 一 功能 的 。 此 外 ， 通 过 处 理 器 与 IO 设 备 接口 之 间 
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传输 数据 也 是 一 种 通用 的 方法 。 在 中 断 程序 中 ， 当 执行 访问 设备 接口 状态 和 数据 寄存 器 的 指令 
时 ， 也 就 相当 于 通知 设备 中 断 请 求 已 经 被 识别 了 。 


程序 1 程序 2 
COMPUTE 程 序 PRINT 程 序 





图 4-5 使 用 中 断 方式 转移 控制 


对 中 断 程序 的 处 理 和 子 程序 十 分 相似 。 但 需要 注意 的 是 二 者 有 着 重要 的 区 别 。 子 程序 被 调 
用 时 执行 的 是 调用 程序 请 求 的 功能 。 而 中 断 服务 程序 与 收 到 中 断 请 求 时 正在 执行 的 程序 毫 不 相 
关 ， 实 际 上 两 个 程序 常常 属于 不 同 的 用 户 。 因 此 在 执行 中 断 服务 程序 之 前 ， 任 何在 程序 执行 期 
间 可 能 被 改变 的 信息 都 必须 保存 起 来 。 这 些 信 息 在 被 中 断 程序 重新 开始 执行 时 必须 重新 装 和 人 。 
这 样 ， 初 始 的 程序 就 可 以 继续 执行 ， 除 了 时 间 延 迟 以 外 不 受 中 断 的 任何 影响 。 需 要 保存 和 恢复 
的 信息 一 般 包括 : 状态 码 标志 、 所 有 中 断 服务 程序 和 被 中 断 程序 都 使 用 的 寄存 器 内 容 。 

保存 和 恢复 信息 的 任务 可 以 由 处 理 器 自动 完成 ， 也 可 以 由 程序 指令 完成 。 大 部 分 现代 处 理 
器 只 保存 能 保持 程序 完整 执行 的 最 小 信息 量 。 这 是 内 为 保存 和 恢复 寄存 器 的 过 程 中 包括 存储 器 
传递 ， 它 将 增加 总 的 执行 时 间 ， 增 加 执行 开销 。 并 且 ， 保存 寄存 器 也 会 增加 从 接收 中 断 请 求 到 
开始 执行 中 断 服 务 程序 之 间 的 时 间 延 迟 。 这 一 延迟 称 为 中 断 等 待 。 在 一 些 应 用 中 ， 过 长 的 中 断 
等 待 是 不 可 接受 的 。 所 以 ， 应 尽量 减少 处 理 器 自动 保存 的 信息 量 。 通 常 ， 处 理 器 只 保存 程序 计 
数 器 和 处 理 器 状态 寄存 器 的 内 容 。 任 何 需 要 保存 的 额外 信息 都 必须 由 程序 指令 在 中 断 处 理 程序 
开始 时 保存 起 来 ， 在 中 断 处 理 完成 后 进行 恢复 。 

在 一 些 早 期 的 处 理 器 中 ,尤其 是 在 那些 只 有 很 少 寄存 器 的 处 理 器 中 ， 收 到 中 断 请 求 时 所 有 
寄存 器 都 被 处 理 器 自动 保存 起 来 。 处 理 完 成 后 ， 由 中 断 返 回 指令 将 这 些 保存 的 信息 恢复 到 各 自 
的 寄存 器 中 。 有 一 些 计算 机 提供 了 两 种 类 型 的 中 断 ， 其 中 一 种 需要 保存 所 有 寄存 器 的 内 容 ， 另 
一 种 不 需要 。 IO 设备 可 以 随意 选择 ， 这 取决 于 对 响应 时 间 的 要 求 。 还 有 一 种 方式 是 复制 处 理 器 
的 寄存 器 组 。 在 这 种 方式 中 ， 中 断 服务 程序 可 以 使 用 另 一 个 不 同 的 寄存 器 组 ， 不 需要 保存 和 恢 
复 寄存 器 。 

中 断 要 比 简单 的 程序 控制 能 更 好 地 协调 MO 传输 。 从 一 般 意 义 上 说 ， 中 断 能 够 由 外 部 事件 引 
起 控制 权 从 一 个 程序 转移 到 另 一 个 程序 。 被 中 断 的 程序 在 中 断 服务 程序 执行 完 后 接着 继续 执行 。 
在 操作 系统 和 很 多 其 他 控制 应 用 中 都 使 用 了 中 断 的 概念 。 在 这 些 应 用 中 ,特定 程序 的 运行 必须 
与 外 部 事件 保持 精确 的 时 间 关 系 ， 这 通常 称 为 实时 处 理 。 


4.2.1 中 断 的 硬件 
IO 设备 通过 激活 总 线 上 的 中 断 请 求 线 来 请 求 中 断 。 大 部 分 计算 机 中 都 有 多 台 可 以 请 求 中 断 
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的 设备 ， 因 此 单 根 中 断 请 求 线 可 能 要 被 n 台 设备 共用 ， 如 图 4-6 所 示 。 所 有 设备 都 通过 接地 开关 连 
接 到 中 断 请 求 线 上 。 当 要 请 求 一 次 中 断 时 ， 设 备 闲 合 与 之 相连 的 开关 。 如 果 所 有 中 断 请 求 信号 
INTR: 到 INTR, 都 是 无 效 的 ， 即 所 有 开关 都 是 断 开 的 ， 中 断 请 求 线 上 的 电 平 就 等 于 Vaa， 此 时 中 断 
请 求 线 处 于 无 效 状态 。 当 一 台 设 备 闭 合 开关 请 求 中 断 时 ， 中 断 请 求 线 上 的 电 平 降 为 0， 处 理 器 接 
收 到 的 中 断 请 求 信号 INTR 就 变 成 了 1。 由 于 闭合 一 个 或 更 多 开关 都 将 导致 请 求 线 上 的 电 平 降 为 0， 
所 以 INTR 的 值 是 所 有 设备 的 中 断 请 求 的 逻辑 “或 ， 即 : 
INTR = INIRI+… +INTR, 
习惯 上 常用 求 反 的 形式 INTR 来 命名 公共 线 上 的 中 断 请 求 信号 ， 因 为 这 个 信号 是 低 电 平 有 效 的 。 





图 4-6 公共 中 断 请 求 线 的 漏 极 开路 总 线 等 效 电路 图 


图 4-6 的 电路 中 ， 使 用 专用 的 集 电极 开路 (open-collector) 门 ( 双 极 型 电路 中 ) 或 漏 极 开路 
(open-drain) 门 (MOS 型 电路 中 ) 来 驱动 和 TR 线 。 集 电极 开路 门 或 漏 极 开路 门 的 输出 与 接地 开 
关 相 同 ， 门 电路 的 输入 为 0 时 开关 断 开 ， 门 电路 的 输入 为 1 时 开关 闭合 。 门 电路 的 输出 电压 (Bi 
逻辑 状态 ) 由 所 有 与 总 线 相 连 的 门 电路 上 的 数据 按照 上 面 给 出 的 等 式 计算 得 到 。 电 阻 R 称 为 上 拉 
电阻 ， 因 为 当 开关 断 开 时 它 将 线路 拉 升 到 高 电 平 状态 。 


4.2.2 中 断 的 允许 和 禁止 


计算 机 所 提供 的 设施 必须 使 程序 员 能 够 完全 控制 程序 执行 期 间 发 生 的 事件 。 当 外 部 设备 中 
断 请 求 到 达 时 ， 处 理 器 将 中 止 一 个 程序 的 执行 转 而 去 启动 另 一 个 程序 。 由 于 随时 都 可 能 出 现 ， 
所 以 中 断 有 可 能 改变 程序 员 预 先 设 定 的 执行 顺序 因此、 必须 谨慎 处 理 程序 执行 中 的 中 断 。 计 
算 机 的 一 个 基本 功能 就 是 能 按照 需要 允许 和 禁止 这 些 中 断 。 下 面 将 详细 分 析 一 下 该 功能 及 其 相 
关 的 设备 。 

在 很 多 情况 下 处 理 器 需要 忽略 中 断 请 求 。 例 如 ， 图 4-5 的 Compute-Print 程 序 中 ， 打 印 机 的 中 
断 请 求 只 有 存在 需要 打印 的 输出 行 时 才能 被 接受 。 在 打印 完 一 组 x 行 中 的 最 后 一 行 后 ， 中 断 就 应 
该 被 禁止 ， 直 到 另 一 组 准备 就 绪 。 在 有 些 情况 下 ， 可 能 需要 保证 特定 的 指令 序列 没有 中 断 地 执 
行 下 去 ， 因 为 中 断 服务 程序 可 能 会 改变 序列 中 某 些 指令 所 需要 的 数据 。 必 须 提供 一 些 允 许 和 禁 
止 中 断 的 方法 供 程 序 员 使 用 。 其 中 一 种 简单 的 方法 就 是 提供 执行 这 些 功能 的 机 器 指令 ， 如 允许 
中 断 和 禁止 中 断 指 令 。 

下 面具 体 考 虑 只 有 一 台 设 备 的 单一 中 断 请 求 的 特殊 情况 。 当 一 人 台 设 备 激 活 中 断 请 求 信号 时 ， 
它 保持 这 个 信号 直到 确认 处 理 器 已 经 接收 了 该 中 断 请 求 。 这 就 是 说 中 断 请 求 信号 在 中 断 服务 程 
序 执行 期 间 将 保持 有 效 ， 也 许 要 持续 到 访问 该 设备 的 指令 到 达 。 另 一 方面 也 要 保证 这 个 有 效 的 








请 求 信号 不 会 导致 连续 的 中 断 ， 使 系统 进入 死 循环 。 解 决 这 个 问题 的 方法 有 几 种 。 这 里 将 描述 
其 中 的 三 种 可 行 方法 ， 可 同时 处 理 多 个 中 断 设 备 的 方法 将 在 后 面 讲述 。 

第 一 种 可 行 方法 是 使 处 理 器 硬件 忽略 中 断 请 求 ， 直 至 中 断 服 务 程序 的 第 一 条 指令 执行 完毕 。 
然后 ， 使 用 一 条 禁止 中 断 指 令 作为 中 断 处 理 程序 的 第 一 条 指令 ， 这 样 程序 员 就 可 以 保证 在 执行 
人 允许 中 断 指 令 前 不 会 发 生 更 多 的 中 断 。 允 许 中 断 指 令 一 般 是 中 断 服 务 程序 中 中 断 返 回 指令 之 前 
的 最 后 一 条 指令 。 处 理 器 必须 保证 在 下 一 次 中 断 出 现 之 前 执行 完 中 断 返回 指令 。 

第 二 种 方法 是 使 处 理 器 在 开始 执行 中 断 服务 程序 前 自动 禁止 中 断 ， 这 种 方法 适用 于 只 有 一 
根 中 断 请 求 线 的 简单 处 理 器 。 在 将 PC 和 处 理 器 状态 寄存 器 (PS) 的 内 容 保 存 到 堆栈 后 ， 处 理 器 
执行 与 禁止 中 断 指 令 等 效 的 操作 。 在 实际 中 ， 我 们 常常 用 PS 寄存 器 中 的 一 位 ， 称 为 中 断 允 许 位 ， 
来 指示 中 断 是 否 被 允许 。 在 该 位 为 1 时 接收 到 的 中 断 请 求 将 被 接受 。 将 PS 的 内 容 保存 到 堆栈 后 ， 
此 时 的 中 断 允 许 位 为 1， 然 后 处 理 器 将 PS 寄存 器 中 的 中 断 允 许 位 清 0， 从 而 禁止 新 的 中 断 发 生 。 
当 执行 中 断 返 回 指令 时 ，PS 寄 存 器 从 堆栈 中 恢复 中 断 前 的 内 容 ， 中 断 允 许 位 被 重 置 1。 这 样 ， 中 
断 被 重新 允许 。 

第 三 种 方法 ， 在 处 理 器 中 有 一 根 特殊 的 中 断 请 求 线 ， 它 的 中 断 处 理 电路 只 在 信号 的 前 沿 响 
应 ， 称 为 边 活 触发 (edge-triggered)。 在 这 种 情况 下 ， 不 论 这 根 线 的 有 效 状态 持续 多 久 ， 处 理 器 
都 只 接收 到 一 个 中 断 请 求 。 因 此 就 没有 多 次 中 断 的 危险 ， 也 不 需要 明确 地 将 这 根 线 禁止 中 断 。 

在 继续 学 习 更 复杂 的 中 断 内 容 前 ， 总 结 一 下 处 理 来 自 单一 设备 的 中 断 请 求 时 包含 的 事件 序 
列 。 假 设 是 允许 中 断 的 ， 下 面 是 一 个 一 般 的 过 程 : 

1. 设备 发 出 一 个 中 渐 请 求 。 

2. 处 理 器 中 止 当 前 执行 的 程序 。 

3. 通过 改变 PS 寄存 器 中 控制 位 的 值 禁止 中 断 (边缘 触发 中 断 除 外 )。 

4. 通知 设备 请 求 已 被 识别 ， 设 备 将 中 断 请 求 信号 撤销 。 

5. 中 断 服务 程序 执行 中 断 请 求 的 操作 。 

6. 允许 中 断 ， 被 中 断 程序 继续 执行 。 


4.2.3 处 理 多 台 设 备 


在 处 理 器 连接 多 台 能 够 发 生 中 断 请 求 的 设备 时 ， 因 为 在 操作 上 这 些 设备 是 相互 独立 的 ， 所 
以 设 有 固定 的 中 断 发 生 顺 序 。 例 如 ， 正 在 处 理 设备 Y 的 中 断 时 设备 X 可 能 又 发 出 中 断 请 求 ， 或 者 

台 设 备 都 在 同一 时 刻 发 出 中 断 请 求 。 这 导致 了 一 系列 的 问题 : 

1. 处 理 器 如 何 识别 发 出 中 断 请 求 的 设备 ? 

2 如 果 不 同 的 设备 要 求 不 同 的 中 断 服务 程序 ， 在 每 一 种 情况 下 处 理 器 怎样 获取 适当 的 程序 
起 始 地 址 ? 

3. 当 有 中 断 正在 被 处 理 时 ， 另 一 台 设 备 是 否 可 以 中 断 处 理 器 ? 

4. 怎样 处 理 两 个 或 更 多 同时 产生 的 中 断 请 求 ? 

不 同 计算 机 处 理 这 些 问 题 的 方法 各 不 相同 ， 解 决 方法 是 决定 计算 机 和 给 定 应 用 相 适 应 与 否 
的 重要 因素 。 . 

在 图 4-6 中 ， 公 共 中 断 请 求 线 上 收 到 一 个 请 求 后 ， 需 要 附加 信息 来 识别 是 哪 一 台 设备 发 出 的 
请 求 。 而 且 ， 如 果 有 两 台 设 备 同 时 发 出 请 求 ， 必 须 可 以 选择 其 中 一 个 进行 处 理 。 执 行 完 选中 设 
备 的 中 断 服 务 程序 后 ， 处 理 器 可 以 响应 第 二 个 中 断 请 求 。 
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可 以 通过 读 取 状态 寄存 器 中 的 信息 来 确定 一 个 设备 是 否 正 在 请 求 中 断 。 当 一 台 设 备 发 出 中 
断 请 求 后 ， 它 的 状态 寄存 器 中 的 一 位 被 置 成 1， 这 一 位 称 为 RQ 位 。 图 4-3 中 的 KIRQ 和 DIRQ 位 就 
分 别 是 键盘 和 显示 器 的 中 断 请 求 位 。 最 简单 的 识别 中 断 设备 的 方法 就 是 用 中 断 处 理 程序 测试 所 
有 与 总 线 相 连 的 VO 设备 。 测 试 到 的 IRQ 位 被 置 1 的 第 一 个 设备 就 是 发 出 中 断 请 求 的 设备 ， 相 应 的 
处 理子 程序 将 被 调用 。 

轮 询 方式 非常 容易 实现 。 它 的 主要 缺点 是 : 设备 即使 没有 发 出 任何 服务 请 求 ， 系 统 也 要 花 
费时 间 去 检查 及 Q 位 。 另 一 种 可 供 选 择 的 方法 是 使 用 向 量 中 断 。 

向 量 中 断 

为 了 节约 检测 过 程 所 花费 的 时 间 ， 请 求 中 断 的 设备 可 以 直接 向 处 理 器 标明 它 自 己 。 然 后 ， 
处 理 器 就 可 以 立即 开始 执行 相应 的 中 断 服务 程序 。 术 语 向量 中 断 指 的 是 所 有 基于 这 种 方法 的 中 
断 处 理 方式 。 

请 求 中 断 的 设备 可 以 通过 总 线 向 处 理 器 发 送 一 个 专门 的 代码 来 标识 自己 。 这 样 ， 即 使 使 用 
同一 根 中 断 请 求 线 ， 处 理 器 仍 可 以 识别 出 每 台 设 备 。 设 备 提供 的 代码 可 以 表示 它 的 中 断 服务 程 
序 的 起 始 地 址 。 代 码 长 度 一 般 为 4 到 8 位 ， 起 始 地 址 的 其 余部 分 由 处 理 器 根据 它 在 存储 器 中 存放 
中 断 服 务 程序 地 址 的 区 域 提 供 。 

这 种 工作 方式 要 求 给 定 设备 的 中 断 服务 程序 必须 总 是 在 同一 位 置 开 始 。 不 过 程序 员 可 以 在 
该 位 置 放 一 条 指令 来 提高 灵活 性 ， 由 该 指令 负责 跳 转 到 相应 的 中 断 服务 程序 。 在 许多 计算 机 中 ， 
这 是 由 中 断 处 理 机 制 自动 完成 的 。 中 断 设备 所 指向 的 位 置 用 来 存储 中 断 服务 程序 的 起 始 地 址 。 
处 理 器 读 取 访 地址 ， 称 为 中 疡 向 量 ， 并 装 入 到 PC 寄存 器 中 。 中 断 向 量 也 可 以 包含 处 理 器 状态 寄 
存 器 的 新 值 。 

大 部 分 计算 机 的 IO 设备 在 数据 总 线 上 发 送 中 斯 向 量 代码 ， 并 使 用 总 线 榨 制 信号 来 确保 设备 
之 间 互 不 干扰 。 当 一 台 设 备 发 送 中 断 请 求 时 ， 处 理 器 可 能 不 能 立即 接收 中 断 向 量 代码 。 例 如 ， 
处 理 器 必须 先 执行 完 当 前 的 指令 ， 而 这 条 指令 可 能 要 求 使 用 总 线 。 而 且 ， 如 果 发 出 请 求 时 恰巧 
该 中 断 被 禁止 ， 就 可 能 会 有 更 长 的 延迟 。 中 断 设备 必须 等 到 处 理 器 准备 接收 时 才能 将 数据 放 到 
总 线 上 去 。 当 处 理 器 准备 好 后 ， 就 激活 中 新 确认 线 INTA。 然 后 MO 设备 发 送 自己 的 中 断 向 量 代码 
进行 响应 ， 并 关闭 INTR 信 和 号 。 

中 断 医 套 

在 4.2.1 节 中 我 们 提 到 在 执行 中 断 服务 程序 期 间 应 该 禁止 中 断 ， 以 保证 同一 设备 的 中 断 请 求 
不 会 导致 多 次 中 断 。 这 一 方式 还 常用 于 多 台 设备 的 情况 ， 在 这 种 情况 下 特定 中 断 服 务 程序 一 旦 
开始 执行 ， 处 理 器 就 必须 等 到 服务 程序 执行 完毕 才能 接受 第 二 个 设备 的 中 断 请求 。 但 中 断 服务 
程序 一 般 都 很 短 ， 导 致 的 延迟 对 于 大 部 分 设备 来 说 都 是 可 以 接受 的 。 

然而 ， 在 某 些 设备 中 ， 响 应 中 断 请 求 时 过 长 的 延迟 将 会 导致 错误 的 操作 。 例 如 ， 有 一 台 使 
用 实时 时 钟 记录 日 常 时间 的 计算 机 。 实 时 时 钟 在 固定 的 时 间 间 隔 内 向 处 理 器 发 送 中 断 请 求 。 对 
每 一 个 请 求 ， 处 理 器 执行 一 个 简短 的 中 断 服务 程序 来 增加 存储 器 中 的 计数 器 组 ， 这 些 计数 器 用 
秒 、 分 等 来 记录 时 间 。 正 确 的 操作 要 求 响应 实时 时 钟 中 断 请 求 的 延迟 必须 小 于 两 个 连续 请 求 之 
间 的 时 间 间 隔 。 为 了 确保 在 存在 其 他 中 断 设备 的 情况 下 满足 这 一 条 件 ， 需 要 在 执行 其 他 设备 中 
断 服务 程序 时 接收 时 钟 的 中 断 请 求 。 

这 个 例子 表明 IO 设备 需要 按照 一 定 优先 级 结构 组 织 起 来 。 在 处 理 低 优先 级 设备 的 中 断 时 ， 
高 优先 级 设备 的 中 断 请 求 应 该 被 接受 。 





多 优先 级 结构 意味 着 在 执行 中 断 服 务 程 序 期 间 ， 一 些 设备 的 中 断 请 求 可 以 接受 ， 而 其 他 一 
些 设备 的 请 求 不 可 以 接受 ， 这 取决 于 设备 的 优先 级 。 为 了 实现 这 种 方式 ， 我 们 可 以 给 处 理 器 分 
配 一 个 优先 级 ， 它 可 以 由 程序 控制 改变 。 处 理 器 的 优先 级 就 是 当前 执行 的 程序 的 优先 级 ， 处 理 
器 只 接受 优先 级 高 于 它 的 设备 的 中 断 。 在 设备 的 中 断 服务 程序 开始 执行 时 ， 处 理 器 的 优先 级 提 
升 为 该 设备 的 优先 级 。 这 一 操作 将 对 同 级 或 较 低级 的 设备 禁止 中 断 ， 而 来 自 更 高 优先 级 设备 的 
中 断 请 求 将 继续 被 接受 。 

处 理 器 的 优先 级 通常 编码 在 处 理 器 状态 字 的 某 一 些 位 中 ， 可 以 被 写 人 PS 寄存 器 的 程序 指令 
改变 。 这 些 指令 都 是 特权 指令 ， 只 有 当 处 理 器 在 管 态 模式 下 运行 时 才能 执行 。 处 理 器 只 有 在 执 
行 操作 系统 程序 时 才 处 于 管 态 模式 。 它 在 开始 执行 用 户 程序 前 转换 为 用 户 模式 。 因 此 ， 用 户 程 
序 无 法 有 意 或 无 意 地 改变 处 理 器 的 优先 级 而 使 操作 系统 崩 祯 。 在 用 户 模式 下 试图 执行 特权 指令 
将 会 导致 一 种 特殊 类 型 的 中 断 ， 称 为 特权 异常 ， 我 们 将 在 4.2.5 节 讲述 这 些 内 容 。 

多 优先 级 模式 可 以 通过 对 每 台 设备 使 用 单独 的 中 断 请 求 和 中 断 确认 线 来 实现 ， 如 图 4-7 所 示 。 
每 根 中 断 请 求 线 分 配 不 同 的 优先 级 。 在 这 些 线 上 收 到 的 中 断 请 求 将 发 送 到 处 理 器 的 优先 级 仲裁 
电路 上 。 只 有 当 优 先 级 高 于 处 理 器 的 优先 级 时 ， 请 求 才 被 接受 。 





优先 级 仲裁 电路 
图 4-7 使 用 独立 的 中 断 请 求 和 确认 线 实现 中 断 优先 级 


同时 请 求 

现在 考虑 两 台 或 多 台 设 备 的 中 断 请 求 同 时 到 达 的 问题 。 处 理 器 必须 决定 哪个 请 求 最 先 被 服务 。 
如 果 采 用 图 4-7 所 示 的 方式 ， 那 么 很 容易 解决 。 只 需 简单 地 接受 优先 级 最 高 的 请 求 即 可 。 然 而 如 
果 几 台 设 备 共 享 一 条 中 断 请 求 线 ， 如 图 4-6 所 示 ， 则 需要 其 他 机 制 来 解决 该 问题 。 

轮 询 1/O 设 备 的 状态 寄存 器 是 最 简单 的 方法 。 这 种 方式 下 ， 优 先 级 由 轮 询 设备 的 顺序 来 决定 。 
当 使 用 向 量 中 断 时 ， 必 须 保证 只 有 一 台 设 备 被 选 定 发 送 它 的 中 断 向 量 代 码 。 一 种 广泛 使 用 的 方法 
是 将 设备 连接 起 来 形成 一 个 莱 花 链 (daisy chain)， 如 图 4-8a 所 示 。 中 断 请 求 线 INTR 被 所 有 设备 
共用 。 中 上 断 确认 线 INTA 以 菊花 链 的 形式 连接 起 来 ， 保 证 INTA 信 号 以 串 行 方式 传递 到 所 有 设备 上 。 
当 有 儿 台 设备 提出 中 断 请 求 时 ，INTR 线 有 效 ， 处 理 器 响应 将 INTA 线 置 为 1!。INTA 信 号 将 被 设备 
1 接收 到 ， 如 果 设 备 1 没有 请 求 任何 服务 ， 它 就 将 信号 传递 给 设备 2。 如 果 设 备 1 有 未 被 响应 的 中 断 
请 求 ， 便 将 阻 断 INTA 信 号 并 接着 将 它 的 识别 码 放 到 数据 线 上 。 因 此 ， 在 菊花 链 结构 中 ， 电 路 上 
最 接近 处 理 器 的 设备 的 优先 级 最 高 。 沿 该 链 次 接近 的 设备 有 第 二 高 的 优先 级 ， 其 他 的 依次 类 推 。 

图 4-8a 所 示 方 式 需要 的 线路 数量 比 图 4-7 中 的 单独 连接 少 得 多 。 图 4-7 所 示 方 式 的 主要 优点 是 ， 
它 可 以 使 处 理 器 根据 设备 的 优先 级 有 选择 地 接受 中 断 请 求 。 将 这 两 种 方式 结合 起 来 我 们 可 以 得 到 
图 4-8b 中 更 加 通用 的 结构 。 设 备 以 组 为 单位 组 织 起 来 ， 每 个 组 有 不 同 的 优先 级 。 在 同一 个 组 内 的 
设备 以 菊花 链 形式 连接 起 来 。 很 多 计算 机 系统 使 用 的 就 是 这 种 结构 。 
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优先 级 仲裁 电路 


b) 优先 级 组 结构 
图 4-8 中 断 优先 级 方式 


4.2.4 控制 设备 请 求 


前 面 我 们 假设 当 1/O 设 备 接口 准备 一 次 传送 时 ， 它 只 产生 一 个 中 断 请 求 。 例 如 在 图 4-3 中 的 
SIN 标 志 等 于 1 时 。 确 保 中 断 请 求 只 来 自 那些 正 被 程序 使 用 的 设备 是 非常 重要 的 。 闲 置 设备 不 允许 
产生 中 断 请 求 ， 即 使 它们 已 经 准备 好 参与 JO 传 送 操作 。 因 此 ， 我 们 需要 一 个 机 制 ， 在 每 台 设 备 
的 接口 电路 中 控制 该 设备 是 否 允 许 产 生 中 断 。 

这 一 控制 在 设备 接口 电路 中 通常 以 中 断 允 许 位 的 形式 提供 。 在 图 4-3 的 CONTROL 寄 存 器 中 ， 
键盘 的 中 断 允许 位 KEN 标 志和 显示 器 的 中 断 允 许 位 DEN 标 志 就 是 用 来 完成 该 功能 的 。 如 果 其 中 一 
个 标志 被 置 位 ， 当 STATUS 寄 存 器 中 相应 的 状态 标志 也 被 置 位 时 ， 接 口 电路 就 产生 一 个 中 断 请 求 。 
同时 ， 当 接口 电路 将 KIRQ 或 DIRQ 分 别 置 位 表示 键盘 或 显示 器 设备 正在 请 求 中 断 时 ， 如 果 中 断 允 
许 位 为 0， 接 口 电路 将 忽略 状态 标志 的 状态 ， 不 产生 中 断 请 求 。 

总 的 来 说 ， 有 两 个 独立 的 机 制 来 控制 中 断 请 求 。 在 设备 端 ， 控 制 寄存 器 中 的 中 断 允 许 位 决定 
设备 是 否 被 允许 产生 中 断 请 求 。 在 处 理 器 端 ，PS 寄 存 器 中 的 中 断 人 允许 位 或 优先 级 结构 决定 特定 的 
中 断 请 求 是 否 被 响应 。 


例 4.3 ”一 个 使 用 中 断 向 量 方式 的 处 理 器 ， 中 断 服 务 程序 的 起 始 地 址 存储 在 存储 器 的 INTVEC 
单元 处 。 将 处 理 器 状态 字 中 的 中 断 允 许 位 下 (假定 它 是 第 9 位 ) 置 1， 则 允许 中 断 。 与 处 理 器 相连 
的 键盘 和 显示 器 单元 具有 图 4-3 所 示 的 状态 、 控 制 和 数据 寄存 器 。 

假设 我 们 希望 在 主 程序 的 某 处 从 键盘 输入 一 行 字符 ， 并 存储 到 存储 器 中 从 LINE 单 元 开始 的 
连续 字 节 区 域 。 如 果 使 用 中 断 来 执行 这 项 操作 ， 需 要 初始 化 中 断 过 程 。 这 一 过 程 可 以 按照 如 下 步 
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1. 将 中 断 服务 程序 的 起 始 地 址 装 入 INTVEC 单 元 。 

2. 将 地 址 LINE 装 入 存储 器 中 的 PNTR 单 元 。 中 断 服 务 程 序 将 使 用 这 个 单元 作为 指针 并 将 输入 
字符 存储 到 存储 器 中 。 

3. 通过 将 CONTROL 寄 存 器 中 第 2 位 置 1 来 允许 键盘 中 断 。 

4. 将 处 理 器 状态 寄存 器 PS 中 的 下 位 置 1， 允 许 中 新 。 

该 初始 化 过 程 完成 后 ， 从 键盘 输入 一 个 字符 就 会 导致 键盘 接口 产生 一 个 中 断 请 求 。 此 时 正在 
执行 的 程序 将 被 中 断 ， 转 去 执行 键盘 输入 中 断 服务 程序 。 该 中 断 服务 程序 必须 执行 以 下 任务 : 

1. 从 键盘 的 输入 数据 寄存 器 中 读 取 输入 字符 。 然 后 ， 接 口 电路 撤销 中 断 请 求 。 

2. 将 字符 存储 到 PNTR 指 向 的 存储 器 位 置 ， 并 递增 PNTR。 

3. 当 到 达 行 尾 时 ， 禁 止 键盘 中 断 并 通知 主 程序 。 

4. 从 中 断 返 回 。 

用 来 执行 这 些 任务 的 指令 如 图 4-9 所 示 。 当 检 测 到 输入 行 的 末端 时 ， 中 断 服务 程序 将 
CONTROL 寄 存 器 中 的 KEN 位 清除 ， 表 示 不 期 望 更 多 的 输入 了 。 同 时 也 将 变量 EOL (End Of Line) 
置 1， 它 在 初始 时 被 置 0。 假 定 主 程序 用 周期 性 的 查询 来 确定 输入 行 是 否 准 备 好 进行 处 理 。 


Move ， 初始 化 缓冲 区 指针 
Clear 清除 行 末 指示 器 

. BitSet ; Yr fb rh tf 
BitSet , 设置 PS 中 的 中 断 允 许 位 


中 断 服务 程序 


READ MoveMultiple RO-R1,- (SP) 保存 寄存 器 RO 和 HR1 到 堆栈 中 
Move PNTR,R0 载 人 地 址 指针 
MoveByte DATAIN.R1 AWA HINU -保存 到 存储 器 
MoveByte R1,(RO)+ 
Move RO,PNTR 更 新 指针 
CompareByte #5$0D,RI 检查 是 否 为 四 车 符 
Branch = 0 RTRN 
Move #1,EOL 指示 行 末 
BitClear #2,CONTROL 然 止 键盘 中 断 
MoveMultiple (SP)+,RO-RI1 恢复 寄存 器 RO 和 R1 
Retum-from-interrupt 





图 4-9 利用 图 4-3 中 的 寄存 器 使 用 中 断 从 键盘 读 入 一 行 字符 
计算 机 中 的 输入 /输出 操作 通常 要 比 这 个 例子 复杂 得 多 。 正 如 我 们 将 在 4.2.5 节 中 描述 的 ， 计 
算 机 操作 系统 在 用 户 级 程序 上 执行 这 些 操作 。 
4.2.5 异常 


中 断 是 导致 一 个 程序 的 执行 被 中 止 、 另 一 个 程序 的 执行 开始 的 事件 。 到 目前 为 止 ， 我 们 处 理 
的 中 断 只 是 由 那些 在 IO 数据 传输 期 间接 收 到 的 请 求 而 引起 的 。 然 而 ， 中 断 机 制 还 可 以 用 在 许多 
其 他 的 情形 下 。 

术语 异常 通常 指 任何 引起 中 断 的 事件 。 因 此 ，IMO 中 断 是 异常 的 一 种 。 现 在 我 们 来 讲述 几 种 
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其 他 类 型 的 异常 。 

错误 恢复 

计算 机 使 用 大 量 的 技术 来 确保 所 有 硬件 都 能 正确 工作 . 例如 , 许多 计算 机 在 主 存 中 有 错误 校 验 码 ， 
它 可 以 监测 存储 的 数据 是 否 正确 。 如 果 出 现 了 错误 ， 控 制 硬件 就 会 检测 到 并 产生 中 断 通知 处 理 器 。 

如 果 检 测 到 错误 或 不 正常 情况 , 即便 此 时 处 理 器 正在 执行 某 个 程序 的 指令 , 也 会 中 断 该 程序 。 
例如 ， 一 条 指令 的 OP 码 字段 有 可 能 不 对 应 任何 合法 指 令 ， 或 一 条 算术 指令 试图 除 以 0。 

当 这 些 错误 引发 异常 时 ， 处 理 器 按照 与 处 理 /O 中 断 请 求 相同 的 方式 进行 处 理 ， 中 止 正在 执 
行 的 程序 并 启动 异常 服务 程序 。 这 个 程序 进行 适当 的 操作 ， 尽 可 能 从 错误 中 恢复 过 来 ， 或 将 该 错 
误 通知 给 用 户 。 回 想 一 下 IO 中 断 时 的 情形 ， 我 们 知道 处 理 器 在 接受 中 断 前 必须 完成 当前 指令 。 
然而 ， 当 中 断 是 由 错误 引起 的 时 候 ， 被 中 断 的 指令 通常 不 等 执行 完 ， 处 理 器 就 转 去 处 理 异 常 。 

调试 

男 一 种 非常 重要 的 异常 用 于 帮助 调试 程序 。 系 统 软件 通常 包括 一 个 调试 器 程序 ， 它 用 来 帮助 
程序 员 找 出 程序 中 的 错误 。 调 试 器 使 用 中 断 来 提供 两 项 重要 的 功能 : 跟踪 和 断 点 。 

当 处 理 器 运行 在 跟踪 模式 下 时 ， 每 执行 完 一 条 指令 就 产生 一 次 异常 ， 异 常服 务 程序 使 是 调试 
程序 。 调 试 程序 使 用 户 可 以 查看 寄存 器 、 存 储 器 等 内 容 。 从 调试 程序 返回 后 接着 执行 被 调试 程序 
的 下 一 条 指令 ， 然 后 再 次 转 到 调试 程序 。 但 在 执行 调试 程序 期 间 是 禁止 跟踪 异常 的 。 

断 点 除了 被 调试 程序 只 在 用 户 选择 的 特定 点 发 生 中 断 外 ， 也 提供 了 与 跟踪 相似 的 功能 。 陷 阱 
和 软件 中 断 指令 用 来 实现 断 点 调试 。 执 行 这 些 指令 和 接收 硬件 中 斯 请 求 是 等 效 的 。 当 调试 一 个 程 
序 时 ， 用 户 可 能 希望 在 指令 i 后 中 断 程序 的 执行 。 调 试 程序 保存 指令 i + 1， 并 用 一 -条 软件 中 断 指令 
取代 它 。 当 程序 执行 到 该 点 时 就 发 生 中 断 ， 转 入 调试 程序 。 这 就 给 了 用 户 一 次 检查 存储 器 和 寄存 
器 内 容 的 机 会 。 当 用 户 准 备 好 继续 执行 被 调试 程序 时 ， 调 试 程序 恢复 被 保存 的 指令 i + 1， 并 执行 
一 条 中 断 返 回 指令 。 

特权 异常 

为 了 保护 计算 机 操作 系统 不 被 用 户 程序 破坏 ， 一 些 特 定 的 指令 只 有 当 处 理 器 处 于 管 态 模式 时 
才 允 许 执行 。 这 些 指令 称 为 特权 指令 。 例 如 ， 当 处 理 器 在 用 户 模式 运行 时 ， 改 变 处 理 器 优先 级 的 
PARRI N ADLE BARR EILDEIR E HET EAT. 试图 执行 这 样 的 指令 将 产生 特权 异 

第， 导致 处 理 器 转 入 到 管 态 模式 并 开始 执行 操作 系统 中 的 相应 程序 。 


4.2.6 在 操作 系统 中 使 用 的 中 断 


操作 系统 (OS) 的 职责 是 协调 计算 机 内 部 所 有 的 活动 。 它 在 执行 JO 操 作 、 与 用 户 程序 通信 
和 控制 用 户 程序 时 使 用 了 大 量 的 中 断 。 中 断 机 制 使 操作 系统 可 以 分 配 优先 级 、 从 一 个 用 户 程序 转 
换 到 另 一 个 用 户 程序 、 实 现 安全 和 保护 特性 、 协 调 VO 活 动 。 后 面 章节 将 对 这 些 做 简要 讨论 ， 而 
本 书 不 是 专门 介绍 操作 系统 的 ， 我 们 的 目标 是 说 明 如 何 使 用 中 断 。 

操作 系统 将 所 有 与 计算 机 相连 的 设备 的 中 断 服务 程序 组 织 在 一 起 。 应 用 程序 本 身 不 执行 JO 
操作 。 当 应 用 程序 需要 进行 MO 操作 时 ， 它 首先 指向 需要 传输 的 数据 ， 然 后 请 求 OS 执 行 操作 。OS 
暂停 执行 该 程序 转 去 执行 请 求 的 MO 操作 。 当 操作 结束 后 ，OS 将 控制 权 传 回 给 应 用 程序 。OS 和 应 
用 程序 之 冯 的 控制 权 传递 是 使 用 软件 中 断 来 实现 的 。 

操作 系统 为 应 用 程序 提供 各 种 各 样 的 服务 。 为 了 便于 实现 这 些 服务 ， 大 部 分 操作 系统 都 有 几 
条 不 同 的 软件 中 断 指令 ， 每 条 指令 都 有 自己 的 中 断 向 量 。 根 据 被 请 求 的 服务 ， 它 们 可 以 调用 OS 
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的 不 同 部 分 。 但 是 ， 有 的 处 理 器 可 能 只 有 一 条 软件 中 断 指 令 ， 该 指令 使 用 一 个 立即 操作 数 来 表示 
特定 的 服务 。 

在 具有 管理 员 和 用 户 两 种 模式 的 计算 机 中 ， 接 到 一 个 中 断 请 求 时 ， 处 理 器 便 切 换 到 管 态 模式 
下 。 处 理 器 首先 将 寄存 器 的 内 容 保存 到 堆栈 里 ， 然 后 设置 处 理 器 状态 寄存 器 中 的 某 一 位 来 实现 这 
一 切换 。 因 此 ， 当 一 个 应 用 程序 通过 软件 中 断 指令 调用 OS 时 ， 处 理 器 将 自动 切换 到 管 态 模式 ， 
这 时 OS 可 以 访问 所 有 的 计算 机 资源 。0S 执 行 中 断 返 回 指令 后 ， 应 用 程序 的 处 理 器 状态 字 从 堆栈 
中 恢复 过 来 ， 处 理 器 切换 回 用 户 模式 。 

为 了 说 明 应 用 程序 和 操作 系统 之 间 的 相互 作用 ， 我 们 来 看 一 个 多 任务 的 例子 。 多 任务 是 处 理 
器 同时 执行 多 个 用 户 程序 的 操作 模式 。 其 中 ， 通 用 的 实现 这 一 模式 的 一 种 OS 技 术 是 时 间 片 (time 
slicing)。 采 用 这 种 技术 ， 每 个 程序 只 运行 一 段 很 短 的 时 间 ， 称 为 时 间 片 z， 然 后 另 一 个 程序 接着 
运行 它 的 时 间 片 ， 如 此 继续 下 去 。 周 期 z 由 连续 运行 的 硬 时 铀 决定 ， 这 个 时 钟 每 r 秒 钟 产生 一 个 中 
Bf. . 

图 4-10 找 述 了 在 多 任务 环境 下 实现 一 些 必 要 功能 所 需 的 程序 。 操 作 系统 启动 时 要 执行 一 个 初 
始 化 程序 ， 在 图 中 称 为 OSINIT。 在 这 个 过 程 中 ， 初 始 化 程序 将 适当 的 值 装 入 到 存储 器 的 中 断 向 
量 区 域 。 这 些 值 对 应 于 不 同 中 断 的 中 断 服 务 程序 起 始 地 址 。 例 如 ，OSINIT 将 SCHEDULER 程 序 的 


起 始 地 址 装 和 到 定时 器 中 断 的 中 断 向 量 中 。 因 此 ， 在 每 一 个 时 间 片 结束 时 ， 定 时 器 中 断 将 启动 该 — 


程序 执行 。 

程序 与 所 有 描述 它 当前 执行 状态 的 信息 一 起 被 操作 系统 视 为 一 个 整体 ， 称 为 进程 。 一 个 进程 
有 三 种 状态 : 和 运行、 就绪 和 阻塞 。 运 行 状 态 指 的 是 程序 当前 正在 被 执行 。 如 果 程 序 已 经 准备 好 执 
行 但 仍 在 等 待 被 调度 程序 选 定 ， 那 么 此 时 进程 就 处 于 就 绪 状 态 。 第 三 种 状态 阻塞 指 的 是 程序 因为 
一 些 原因 而 没有 准备 好 开始 执行 。 比 如 ， 它 可 能 正在 等 待 所 请 求 的 MO 操作 的 完成 。 

假设 程序 A 在 一 个 特定 时 间 片 内 处 于 运行 状态 。 在 该 时 间 片 结束 时 ， 定 时 器 中 断 这 个 程序 的 
执行 并 开始 执行 SCHEDULER。SCHEDULER 是 一 个 操作 系统 例 行 程序 ， 它 来 决定 哪个 用 户 程序 
占用 下 个 时 间 片 。 该 程序 首先 保存 以 后 继续 执行 程序 A 所 需要 的 全 部 信息 。 这 些 保存 的 信息 称 为 
程序 状态 ， 包 括 寄存 器 的 内 容 、 程 序 计 数 器 和 处 理 器 状态 字 。 保 存 寄 存 器 的 内 容 是 因为 它 可 能 包 
括 中 断 发 生 时 一 些 正 在 进行 的 计算 的 中 间 结 果 。 程 序 计 数 器 指向 下 一 次 开始 执行 的 位 置 。 处 理 器 
状态 字 也 需要 保存 ， 因 为 它 包含 着 状态 码 标志 以 及 其 他 信息 ， 比 如 优先 级 等 。 

然后 ，SCHEDULER 选 择 执行 另 一 程序 B， 程 序 B 在 早 些 时 候 被 中 断 并 正 处 于 就 绪 状 态 。 
SCHEDULER 将 B 程 序 中 断 时 保存 的 所 有 信息 恢复 ， 包 括 PS 和 PC 的 内 容 ， 然 后 执行 一 条 中 断 返 回 
指令 。 于 是 ， 程 序 B 就 重新 开始 执行 t 秒 钟 ， 在 这 个 时 间 片 结束 时 定时 器 时 钟 再 次 产生 一 个 中 断 ， 
并 产生 到 另 一 个 就 绪 进 程 的 上 下 文 切 换 。 | 

假设 程序 A 需 要 从 键盘 读 人 一 个 输入 行 。 它 并 不 亲自 执行 这 个 操作 ， 而 是 向 操作 系统 请 求 1O 
服务 。 它 使 用 堆栈 或 处 理 器 寄存 器 向 OS 传 递 信息 来 描述 请 求 的 操作 、IO 设 备 和 程序 数据 区 域 中 
存放 输入 行 的 缓冲 区 地 址 。 然 后 执行 一 条 软件 中 断 指 令 ， 这 条 指令 的 中 断 向 量 指向 图 4-10a 中 的 
OSSERVICES 程 序 。OSSERVICES 程 序 检查 堆栈 中 的 信息 并 调用 适当 的 OS 程序 启动 请 求 的 操作 。 
在 此 例 中 ， 它 将 调用 图 4-10b 中 的 IOINIT 程 序 ， 该 程序 负责 启动 1/O 操 作 。 

当 进 行 WO 操 作 时 ， 请 求 操作 的 程序 不 能 继续 执行 。 因 此 ，IOINIT 程 序 将 与 程序 A 相关 联 的 进 
程 设 置 成 阻塞 状态 ， 向 调度 程序 表明 这 个 程序 此 时 不 能 继续 执行 。IOINIT 程 序 执行 WO 操作 需要 
的 所 有 准备 工作 ， 如 初始 化 地 址 指针 和 字 节 计数 器 ， 然 后 调用 一 个 程序 执行 //O 的 传输 。 
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,设置 中 断 向 量 
' 时 间 片 时 钟 ~ SCHEDULER 
软件 中 断 — OSSERVICES 
键盘 中 断 — IOData 


OSSERVICES HEI, GENRER 


调用 适当 的 程序 
SCHEDULER 保存 程序 状态 

选择 - -个 就 绪 进程 

恢复 保存 的 新 进程 的 上 下 文 

将 PS 和 PC 的 新 值 压 人 栈 中 

返回 中 断 


a) OS 初始 化 、 服 务 程序 和 调度 程序 





进程 状态 设置 为 “阻塞 ”状态 

初始 化 存储 啥 缓冲 区 地 址 指针 和 计数 器 
调用 设备 驱动 程序 ， 初 始 化 设备 并 在 设备 接口 允许 中 断 
从 子 程序 返回 


IODATA 轮 询 设 备 ， 确 定 中 斯 源 
调用 适当 的 虹 动 程序 
如 果 END=1， 则 设置 进程 状态 为 “就 绪 ” 
hf aB lil 





b) VO 程序 


KBDINIT 允许 中 断 
从 子 程序 返回 
KBDDATA 检查 设备 状态 


如 果 就 绪 ， 便 传输 字符 
如 果 字 符 =CR， 则 {设置 END=1; 禁止 中 断 }， 否 则 设置 END=0 
从 子 程序 返回 





c) 键盘 驱动 程序 
图 4-10 几 个 操作 系统 程序 


设计 操作 系统 时 普遍 使 用 的 方法 是 将 所 有 属于 特定 设备 的 软件 封装 成 一 个 独立 的 模块 ， 称 为 
设备 驱动 程序 。 这 样 的 模块 可 以 很 容易 地 添加 到 OS 中 或 从 OS 中 删除 。 在 该 例子 中 键盘 的 设备 驱 
动 程序 由 两 个 程序 组 成 : KBDINIT 和 KBDDATA ， 如 图 4-10c 所 示 。IOINIT 程 序 调用 KBDINIT， 
KBDINIT 用 来 初始 化 设备 和 接口 电路 所 需要 的 信息 ， 同 时 KBDINIT 还 通过 在 接口 电路 中 设置 控制 
寄存 器 的 相应 位 来 允许 中 断 ， 然 后 返回 IOINIT，IOINIT 再 返回 到 OSSERVICES。 至 此 键盘 已 准备 
好 数据 传输 操作 了 。 它 将 在 一 个 键 被 按 下 时 产生 中 断 请 求 。 

返回 到 OSSERVICES 后 ，SCHEDULER 程 序 选择 另 一 个 用 户 程序 运行 。 当 然 ， 调 度 程序 不 会 
选择 程序 A， 因 为 它 正 被 阻塞 。 中 断 返 回 指令 不 仅 能 使 被 选 定 的 用 户 程序 开始 执行 ， 同 时 还 能 通 
过 向 处 理 器 状态 寄存 器 中 装 入 新 值 来 允许 中 新 。 这 样 ， 键 盘 接口 电路 产生 的 中 断 请 求 将 被 接受 ， 
该 中 断 的 中 断 向 量 指向 一 个 称 为 IJODATIA 的 OS 程 序 。 因 为 可 能 会 有 几 人 台 设 备 连接 到 同一 根 中 断 请 
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求 线 上 ， 所 以 IODAIA 首 先 测试 这 些 设 备 ， 以 确定 发 出 请 求 的 设备 ， 然 后 调用 适当 的 设备 驱动 程 
序 来 为 该 请 求 服务 。 在 我 们 的 例子 中 ， 调 用 的 驱动 程序 是 KBDDATA ， 它 将 传输 一 个 字符 的 数据 。 
如 果 是 回 车 符 ， 它 还 将 END 标 志 置 为 1 来 通知 JODATA 此 次 1/O 操 作 已 经 完成 。 同 时 ，IODATA 程 序 
将 进程 A 的 状态 由 阻塞 变 为 就 络 ， 调 度 程序 在 未 来 的 时 间 片 中 便 可 以 选择 进程 A 了 。 


4.3 ”处理 器 举例 


前 面 我 们 概括 地 讲述 了 中 断 机 制 。 商 业 处 理 器 提供 了 很 多 前 面 描述 的 特性 和 控制 机 制 ， 但 并 
不 是 所 有 的 机 制 都 是 必需 的 。 例如 向 量 中 断 使 得 处 理 器 能 够 迅速 跳 转 到 特定 设备 的 中 断 服务 程序 。 
但 除 此 之 外 ， 识 别 设备 和 确定 适当 的 中 断 处 理 程序 起 始 地 址 的 任务 也 可 以 由 软件 使 用 轮 询 方法 来 
实现 。 下 面 我 们 将 讲述 第 3 章 中 所 描述 的 三 种 处 理 器 的 中 断 处 理 机 制 。 


4.3.1 ARM 中 断 结 构 


ARM 处 理 器 有 一 个 简单 但 强大 的 异常 处 理 机 制 。 有 5 种 类 型 的 异常 ， 其 中 只 有 两 种 是 外 部 中 
断 请 求 线 : IRQ 和 FIQ (快速 中 断 请 求 )。 还 有 一 条 软件 中 其 指令 SWI 和 两 种 由 程序 执行 期 间 遇 到 
的 不 正常 情况 引起 的 异常 。 这 两 种 异常 分 别 是 总 线 错误 引起 的 外 部 故障 和 试图 执行 未 定义 的 指令 。 
异常 按照 下 面 的 优先 级 进行 处 理 : 

1. 复位 〈 最 高 优先 级 ) 

. 2. 数据 中 止 

3. FIQ 

4.IRQ 

5. 预 取 中 止 

6. 未 定义 指令 (最低 优先 级 ) 

复位 条 件 被 包括 在 这 个 结构 中 ， 是 因为 它 必须 超越 所 有 其 他 条 件 将 处 理 器 恢复 到 一 个 已 知 的 
初始 条 件 下 。 还 注意 到 有 两 种 中 止 条 件 : 数据 中 止 (Data Abort) 是 由 读 写 错误 引起 的 ， 预 取 中 
止 (Prefetch Abort) 是 由 从 存储 器 中 预 取 指令 时 发 生 的 错误 引起 的 。 

图 3-1 显 示 了 ARM 处 理 器 的 状态 寄存 器 CPSR (Current Program Status Register， 当 前 程序 状态 
寄存 器 )。 该 寄存 器 低位 字 节 如 图 4-11 所 示 。 其 中 有 两 个 中 断 屏蔽 位 ， 分 别 对 应 人 RQ 和 FIQ。 当 其 
中 一 位 等 于 1 时 ， 相 应 的 中 断 就 被 禁止 了 。 这 个 寄存 器 还 包括 5 个 模式 位 Ms_o， 指 示 处 理 器 正在 运 
行 的 模式 。ARM 共 有 6 个 模式 一 一 1 个 用 户 模 式 和 5 个 特权 模式 (分别 对 应 5 种 异常 )。 

当 处 理 器 转换 到 不 同 模式 时 ,同时 也 要 转换 程 7 6 s a 3 2 |1 1 
序 可 访问 的 某 些 寄存 器 。 每 种 模式 下 能 访问 的 寄存 ' | | 
器 组 如 图 4-12 所 示 。 寄 存 器 RO 到 R7、R15 (PC) 和 Tr [m [m [w [m m] 
CPSR 在 所 有 模式 下 都 可 以 访问 。 在 特权 模式 下 ，。 AOU ARM 处 理 器 状态 寄存 器 的 低位 字 节 
除 FQ、R8 到 R12 也 都 是 可 以 访问 的 。 在 IRQ、 管 态 、 中 止 和 未 定义 模式 下 均 有 两 个 新 的 寄存 器 取 
代 R13 和 R14。 在 FIQ 模 式 中 ， 寄 存 器 R8 到 R14 被 R8_fiq 到 R14_fiq 代 款 。 取 代用 户 模式 寄存 器 的 寄 
存 器 称 为 保留 寄存 器 。 它 们 可 以 被 中 断 服 务 程序 使 用 ， 因 而 就 不 需要 保存 用 户 模式 下 对 应 寄存 器 
的 内 容 。 例 如 ， 在 民 Q 模 式 下 当 一 条 指令 访问 寄存 器 R13 时 ， 被 访问 的 寄存 器 是 R13_irq 而 不 是 用 
户 模式 下 的 寄存 器 R13。 而 且 ， 除 用 户 模式 外 的 每 个 模式 都 有 一 个 专用 的 寄存 器 ， 称 为 保存 处 理 
器 状态 寄存 器 (如 SPSR_svc，SPSR_irq 等 )。 当 发 生 中 断 时 ， 它 用 来 保存 寄存 器 CPSR 的 内 容 。 
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225 图 4-12 ARM 处 理 器 不 同 模式 下 可 以 访问 的 寄存 器 
异常 处 理 程序 总 是 从 存储 器 中 的 固定 位 置 启动 ， 如 表 4-1 所 示 。 中 断 之 后 ， 处 理 器 进入 指定 


的 模式 并 在 相应 的 向 量 地 址 开始 执行 程序 。 由 于 除了 最 后 地 址 (FIQ) 以 外 只 有 一 条 指令 空间 ， 
所 以 该 位 置 应 该 包括 跳 转 到 服务 程序 的 指令 。 在 FIQ 模 式 下 ， 服 务 程序 不 需要 使 用 跳 转 指 令 就 可 





以 从 所 示 的 起 始 位 置 继续 执行 。 
表 4-1 ARM 处 理 句 中 的 中 断 向 量 地 址 

地 4 

(63890) 异 党 进入 的 模式 
M 复位 管 态 
4 未 定义 指令 REX 
8 软件 中 断 RE 
c 预 取 中 止 中 止 
10 数据 中 止 中 止 
14 保留 
18 IRQ IRQ 








当 处 理 器 收 到 一 个 中 断 时 ， 它 执行 以 下 操作 : 

1. 保存 被 中 断 程 序 的 返回 地 址 到 相应 模式 下 的 寄存 器 R14 中 。 例 如 ， 在 FIQ 模 式 下 ， 它 将 返 
回 地 址 保存 到 寄存 器 R14_fiq 中 。 保 存 的 具体 值 依 赖 于 中 断 类 型 ， 我 们 将 会 进行 简要 的 解释 。 

2. 保存 处 理 器 状态 寄存 器 CPSR 的 内 容 到 相应 的 SPSR 中 。 

3. 根据 中 断 类 型 改变 CPSR 中 的 模式 位 ， 如 表 4-1 中 最 后 一 列 所 示 。 对 于 FIQ 和 IRQ 两 种 模式 ， 
处 理 器 还 将 CPSR 中 相应 的 屏 项 位 置 1 以 禁止 同一 条 线 上 更 多 的 中 断 。 

4. 跳 转 到 从 相应 向 量 地 址 开始 的 中 断 服务 程序 。 

ARM 处 理 器 采用 流水 线 结 构 ， 我 们 将 在 第 8 章 中 详细 解释 。 这 种 结构 指 的 是 在 前 一 条 指令 
执行 完 之 前 就 开始 预 取 下 一 条 指令 。 假 设 处 理 器 在 某 个 地 址 A 处 取得 指令 I1。 处 理 器 将 PC 寄存 
器 中 的 值 增加 到 A + 4 并 开始 执行 指令 I1。 在 执行 完 这 条 指令 前 , 它 从 地 址 A + 4 处 预 取得 指令 D， 
然后 将 PC 的 值 增加 到 A + 8。 现 在 假设 在 指令 I 执行 结束 时 处 理 器 检测 到 一 个 人 RQ 中 断 ， 于 是 处 
理 器 就 开始 执行 上 面 描 述 的 操作 。 它 将 PC 中 的 内 容 复 制 到 寄存 器 R14_irq 中 ,此 时 PC 的 值 为 A + 8。 
这 样 已 经 取出 但 没有 执行 的 指令 I 就 被 放弃 了 ， 但 这 个 指令 是 中 断 服务 程序 必须 返回 到 的 指 
令 。 

在 上 面 讲述 的 情况 中 ， 保 存 到 R14_irq 中 的 值 是 A+8， 但 中 断 服 务 程序 返回 的 地 址 必须 是 A+ 4。 
这 就 是 说 中 断 程 序 在 R14_irq 中 的 内 容 作 为 返回 地 址 之 前 必须 将 其 减 去 4。 也 就 是 说 ， 返 回 指 令 必 
须 将 值 [R14_irq] - 4 装 入 到 PC 中 。 当 然 ， 也 必须 将 SPSR_irq 的 内 容 复制 到 CPSR 中 。 后 一 操作 将 
处 理 器 恢复 到 中 断 发 生前 的 运行 模式 ， 并 且 也 清除 了 中 断 屏蔽 并 再 次 允许 中 断 。 要 求 的 操作 可 
由 指令 

SUBS PC,R14_irq, #4 


来 执行 。 这 条 指令 从 R14_irq 中 减 去 4 然后 将 结果 存储 到 R15 中 。 后 级 S 通 常 指 的 是 设置 状态 码 。 当 
这 条 指令 的 目标 寄存 器 是 PC 时 ， 后 缀 $ 使 处 理 器 将 SPSR_irq 中 的 内 容 复 制 到 CPSR 中 ， 从 而 完成 返 
回 到 被 中 断 程序 所 需要 的 操作 。 
为 了 获得 正确 的 返回 地 址 ， 从 R14 中 减 去 的 数值 大 小 依赖 于 处 理 器 流水 线 指令 执行 的 具体 情 
况 。 因 此 ， 对 于 不 同 的 异常 这 个 数值 是 不 同 的 。 例 如 ， 在 由 SWI 指 令 触 发 的 软件 中 断 中 ， 保 存在 
R14_svc 中 的 值 本 身 就 是 正确 的 返回 地 址 。 因 此 ， 从 SWI 服 务 程序 返回 可 以 由 指令 
. : ` MOVS PC, R14_svc 
完成 。 表 4-2 给 出 了 表 4-1 中 每 种 异常 的 正确 返回 地 址 和 返回 到 被 中 断 程序 的 指令 。 需 要 注意 的 是 ， 
对 于 中 止 中 断 , 可 能 是 由 于 总 线 错误 导致 的 , 表 中 显示 的 期 望 返回 地 址 是 导致 该 错误 指令 的 地 址 。 
这 里 假设 控制 软件 希望 重新 执行 该 指令 。 
在 特权 模式 下 运行 时 ， 有 两 条 专门 的 MOV 指 令 MSR 和 MRS 传 送 来 自 或 发 送 给 PSR 的 数据 ， 
这 些 数据 可 以 是 PSR 的 当前 数据 或 者 保存 在 PSR 中 的 数据 。 例 如 
I MRS RO, CPSR 
将 CPSR 的 内 容 复制 到 RO0。 相 似 地 ， 
: MSR SPSR, RO 


将 寄存 器 R0 中 的 内 容 复制 到 SPSR 中 。 这 些 指令 在 操作 系统 需要 允许 /禁止 中 斯 时 非常 有 用 ， 在 后 
面 例 4.4 中 我 们 将 看 到 这 一 点 。 
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表 4-2 异常 返回 时 的 地 址 修正 


异 党 保存 的 地 址 9 正确 的 返回 地 址 返回 指令 

未 定义 指令 PC+4 PC+4 MOVS PC, R14_und 

软件 中 断 PC+4 PC+4 MOVS PC, R14_svc 

预 取 中 止 PC+4 PC SUBS PC, R14_abt, #4 

数据 中 止 PC+8 PC SUBS PC, R14_abt, #8 

IRQ PC+4 PC SUBS PC, R14_irq, #4 

FIQ PC+4 PC SUBS PC, R14_fiq, #4 
O PCX S$ S E 6548 OE, A&TRQ#FIQP, PCR WT PW GI KIA R 4824 6 b. 
Mintis 


ARM 的 中 断 机 制 将 返回 地 址 存储 在 一 个 寄存 器 中 ， 而 不 是 自动 实现 堆栈 机 制 来 允许 子 程序 
或 中 断 嵌 套 。 这 样 做 对 程序 员 有 如 下 好 处 : 当 需 要 时 可 以 实现 该 功能 ， 当 不 需要 时 可 避免 不 必要 
的 开销 。 首 先 ,不 同 中 断 源 可 以 引起 中 断 能 套 。 例 如 ， 下 Q 中 断 服务 程序 的 返回 地 址 在 Ri4_irq 中 ， 
可 能 被 优先 级 更 高 的 FIQ 中 断 。 新 的 返回 地 址 将 被 保存 在 Ri4_fiq 中 。 

为 了 实现 来 自 同 一 中 断 源 的 中 断 储 套 ， 相 应 的 R14 和 SPSR 中 的 内 容 必 须 被 保存 到 堆栈 中 。 这 
种 做 法 可 以 很 容易 地 由 程序 指令 使 用 R13 作 为 堆栈 指针 来 实现 。 所 以 ， 在 所 有 模式 中 都 有 专用 的 
寄存 器 R13 和 R14。 中 断 服 务 程序 可 以 将 R14 和 SPSR 保 存 到 自己 的 私有 堆栈 中 ， 然 后 清除 CPSR 中 
的 中 断 屏蔽 位 。 也 可 以 将 其 他 寄存 器 保存 到 私有 堆栈 中 以 产生 所 需要 的 额外 操作 空间 。FIQ 模 式 
用 作 快 速 中 断 ， 可 以 利用 从 R8_fiq 到 R13_fiq 的 专用 寄存 器 ， 所 以 不 需要 将 寄存 器 保存 到 堆栈 中 。 

我 们 在 第 3 章 中 曾 指出 LDM 和 STM 指 令 能 够 传送 多 个 字 ， 可 以 非常 方便 地 用 于 处 理 堆栈 操作 。 例 
如 ， 使 用 R13 作为 堆栈 指针 ， 子 程序 或 中 断 服务 程序 可 以 使 用 下 面 的 指令 来 保存 寄存 器 和 返回 地 址 : 

STMFD R13!, { RO, R1,R2, R14 ) 


相似 地 ，LDMFD 指 令 可 以 用 来 恢复 被 保存 的 值 。 在 SWI 或 指令 预 取 异 常 中 ， 恢 复 到 R14 中 的 值 也 
是 正确 的 返回 地 址 。 因 此 ， 这 个 值 可 以 直接 恢复 到 R15 中 ， 返 回 到 被 中 断 程序 的 指令 如 下 : 
LDMFD R13!, (R0, R1, R2, R15JA 


指令 末尾 的 “^” 符 号 与 前 面 SUBS 指 令 中 $ 后 织 的 作用 相同 ， 它 使 处 理 器 在 装 入 R15 的 同时 将 
SPSR 复 制 到 CSPR 中 。 需 要 注意 的 是 LDM 不 能 用 来 从 及 Q 和 FIQ 中 断 返回 ， 因 为 R14 中 的 内 容 必 须 
首先 进行 如 表 4-2 所 示 的 修正 。 


例 4.4 ”图 4-13 给 出 了 一 个 使 用 中 断 的 例子 ， 它 是 图 4-9 中 的 程序 对 ARM 处 理 器 的 重 写 ， 我 们 
已 经 假设 键盘 是 连接 到 中 断 线 了 Q 上 的 ， 并 且 在 相应 的 中 断 向 量 位 置 包含 一 条 跳 转 到 READ 的 指 
Ç. 还 假设 在 进入 这 个 代码 段 时 存储 器 缓冲 区 地 址 LINE 已 经 装 到 了 PNTR 单 元 中 。 同 时 假定 
PNTR 和 BEOL 的 单元 在 地 址 空间 里 是 足够 接近 的 ， 它 们 可 以 使 用 相对 地 址 模式 进行 访问 。 主 程序 
通过 设置 键盘 CONTROL 寄 存 器 中 的 KEN 标 志 并 清除 处 理 器 状态 寄存 器 的 I 屏 项 位 ， 来 允许 键盘 接 
口 和 处 理 器 中 断 。 清 除 [ 屏 项 位 (第 7 位 ) 是 通过 MSR 指 令 将 值 $50 装 人 到 CPSR 中 来 实现 的 。 

在 中 断 服务 程序 中 ， 我 们 使 用 LDM 和 STM 指 令 保存 和 恢复 寄存 器 ， 使 用 SUBS 指 令 返回 被 中 
断 的 程序 ， 使 用 3.4.1 节 中 描述 的 ADR 指 令 将 图 4-3 中 键盘 的 DATAIN 寄 存 器 的 地 址 装 入 到 处 理 器 寄 
存 器 中 。 假 定 控制 寄存 器 CONTROL 的 地 址 为 DATAIN+3。 
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MOV RO0,#0 

STR RO,EOL 清除 EOL 标 志 

ADR R1,DATAIN 载 入 寄存 器 DATAIN 的 地 址 

LDRB RO,[R1,#3] 获取 CONTROL 寄 存 器 的 内 容 
ORR RO,RO,#4 设置 寄存 器 CONTROL 中 的 KEN 位 
STRB RO,[R1,#3] 来 允许 键盘 中 断 I 
MOV RO,#&50 在 处 理 器 中 允许 IRQ 中 断 并 转换 色 
MSR CPSR,R0 用 户 模式 


-RQ 中 断 服务 程序 


R13!, {RO-R2,R14 irq} 保存 RO、R1 和 R14_irq 到 堆栈 中 
RILDATAIN 载 人 寄存 器 DATAIN 的 地 址 
RO,[R1] 获取 输入 字符 

R2,PNTR 载 人 指针 值 

RO,[R2],#1 TETIERE 
R2,PNTR 更 新 存储 器 中 指针 的 值 
RO,#&0D 检查 是 否 为 名 车 符 
R13!,{RO-R2,R14 -irq} 如 果 不 是 ， 馈 复 寄存 器 并 返回 
PC,R14-irq,#4 

RO,[R1,#3] 否则 ， 获 取 CONTROL 寄存 器 
R0,R0,#&FB 消除 KEN 位 来 林 止 键盘 中 断 
RO,[R1,#3] 

RO,#1 设置 EOL 标 志 

RO,EOL 

R13!,{RO-R2,R14 } 恢复 寄存 器 

PC,R14irq,#4 并 返回 





图 4-13 对 应 图 4-9， 从 键盘 读 人 一 行 输入 的 ARM 中 断 服务 程序 
4.3.2 68000 中 断 结 构 


68000 有 8 个 中 断 优 先 级 。 在 特定 时 间 处 理 器 运行 的 优先 级 被 编码 在 处 理 器 状态 字 的 3 个 位 中 ， 
如 图 4-14 所 示 ， 其 中 0 级 的 优先 级 最 低 。 与 68000 相 连 的 MO 设备 采用 与 图 4-8b 相 似 的 排列 方式 ， 在 
这 种 方式 中 中 斯 请 求 被 分 配给 1 到 7 范围 内 的 优先 级 。 中 断 请 求 只 有 在 它 的 优先 级 高 于 处 理 器 的 优 
先 级 时 才 被 接受 ， 但 有 一 个 例外 : 优先 级 为 7 的 请 求 在 任何 时 候 都 会 被 接受 ， 它 是 一 个 边缘 触发 
的 不 可 屏蔽 的 中 断 。 处 理 器 接受 一 个 中 断 请 求 后 ， 在 执行 中 断 服 务 程 序 之 前 PS 寄存 器 中 指示 的 优 
先 级 自动 提升 为 中 断 请 求 的 优先 级 。 因 此 ， 除 了 7 级 以 外 ， 其 他 同 级 或 低级 的 中 断 请 求 将 被 禁止 ， 
7 级 中 断 总 是 被 允许 的 。 

在 中 断 发 生 时 处 理 器 自动 保存 程序 计数 器 和 处 理 器 状态 字 的 内 容 。PC 被 压 入 到 处 理 器 的 堆 
栈 中 ， 紧 接着 PS 也 被 压 人 到 堆栈 中 ， 使 用 寄存 器 A7 作 堆栈 的 指针 。 在 68000 汇 编 语言 中 ， 中 断 返 
回 指令 称 为 异常 返回 (RTE)， 将 栈 顶 单元 弹出 到 PS 中 ， 将 下 一 个 单元 弹出 到 PC 中 。 如 图 4-14 所 
示 ，PS 寄 存 器 中 包括 一 个 管理 位 S 和 一 个 跟踪 位 T。S 位 确定 处 理 器 运行 在 管 态 模式 (S=1) 还 是 
用 户 模式 (S=0)。T 位 对 许 一 类 特殊 的 中 断 ， 称 为 跟踪 异常 ， 在 4.2.4 节 中 已 经 进行 了 描述 。 这 些 
信息 在 接受 中 断 时 将 被 自动 保存 起 来 ， 在 中 断 服务 结束 后 重新 饶 复 。 而 任何 其 他 需要 保存 的 附加 
音 息 ， 如 通用 寄存 器 的 内 容 ， 必 须 在 中 断 服务 程序 内 部 被 明确 地 保存 和 恢复 ， 
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图 4-14 68000 处 理 器 的 处 理 器 状态 寄存 器 


68000 处 理 器 使 用 了 向 量 中 断 。 当 接受 一 个 中 断 请 求 时 ， 从 存储 在 主 存 中 的 中 断 向量 中 获取 
中 断 服务 程序 的 地 址 。68000 共 有 256 个 中 断 向 量 ， 编 号 为 0 到 255。 每 个 中 断 向 量 由 32 位 组 成 ， 这 
32 位 构成 所 需要 的 起 始 地 址 。 当 一 台 设 备 请 求 中 断 时 ， 它 通过 向 处 理 器 发 送 指向 相应 中 断 向 量 的 
8 位 疝 量 编号 来 响应 中 断 应答 信 号 。 此 外 ，68000 还 提供 了 一 个 自动 向 量 功 能 ， 它 取代 了 发 送 向 量 
编号 。 设 备 可 以 激活 一 条 专门 的 总 线 控制 线路 表示 它 希 望 使 用 自动 向 量 功能 。 在 这 种 情况 中 ， 处 
理 器 将 根据 中 断 请 求 的 优先 级 选择 7 个 专门 用 于 此 目的 的 向 量 中 的 一 个 。 


例 4.5 ”图 4-15 是 一 个 在 68000 中 使 用 中 断 的 例子 。 它 是 图 4-9 中 的 程序 对 68000 的 重 写 。 我 们 
假定 键盘 接口 电路 使 用 自动 向 量 ， 并 且 产 生 的 中 断 请 求 的 优先 级 为 2。 因 此 ， 为 了 允许 中 断 ， 处 
理 器 的 优先 级 必须 设置 成 低 于 2 级 。 当 将 位 匹配 模式 $100 装 人 到 寄存 器 PS 后 ， 处 理 器 的 优先 级 就 
被 设置 为 1。 





MOVEL 初始 化 缓冲 区 指针 
CLR 清除 行 末 指示 器 
ORLB ， 设置 KEN 位 

MOVE ， 设置 处 理 器 优先 级 为 1 


中 断 服务 程序 
保存 寄存 器 A0，D0 到 堆栈 


载 入 地 址 指针 

获取 输入 字符 

将 它 存储 到 存储 器 缓冲 区 
更 新 指针 
检查 是 否 为 回 车 符 


指示 行 末 
， 清除 KEN 位 
(A7)+,A0/D0 恢复 寄存 器 DO，A0 





图 4-15 对 应 图 4-9， 从 键盘 读 和 人 一行 输 入 的 68000 中 断 服务 程序 
4.3.3 Pentium 的 中 断 结构 


Pentium 处 理 器 是 IA-32 体 系 结构 的 一 个 例子 。 这 种 体系 结构 使 用 两 根 中 断 请 求 线 : 一 根 是 不 
可 屏蔽 中 断 《NMI)， 另 一 根 是 可 屏蔽 中 断 ， 也 称 为 用 户 中 断 请 求 INTR。NMI 上 的 中 断 请 求 任何 
时 候 都 必须 被 处 理 器 接受 。 而 INTR 上 的 中 断 请 求 只 有 在 它 的 优先 级 高 于 当前 执行 程序 的 优先 级 
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时 才 被 接受 ， 后 面 我 们 将 对 此 简要 介绍 。 也 可 以 通过 设置 处 理 器 状态 寄存 器 中 的 中 断 允 许 位 来 允 
许 和 禁止 INTR 中 断 的 发 生 。 

除了 外 部 中 断 外 ， 在 程序 执行 期 间 发 生 的 事件 可 以 导致 异常 。 这 些 事件 包括 无 效 操作 码 、 除 
法 错误 、 溢 出 以 及 其 他 事件 ， 也 包括 跟踪 和 断 点 中 断 。 

这 些 事件 中 任何 一 个 的 发 生 都 会 使 得 处 理 器 转移 到 中 断 服 务 程序 中 。 每 一 个 中 断 或 异常 都 分 
配 一 个 向 量 编号 。 在 INTR 中 断 中 ， 当 中 断 请 求 被 响应 时 ， 向 量 编号 由 WO 设备 通过 总 线 发 送 。 对 
于 其 他 异常 ， 向 量 编号 都 是 预先 分 配 的 。 根 据 向 量 编号 ， 处 理 器 从 中 断 向 量 表 中 获得 中 断 服务 程 
# 的 起 始 地 址 。 

Pentium 处 理 器 还 附带 有 一 个 高 级 可 编程 中 断 控制 器 (APIC) 芯片 。 各 种 设备 通过 这 个 芯片 
连接 到 处 理 器 。 中 断 控制 器 在 不 同 设备 间 实 现 一 个 优先 级 结构 ， 并 为 每 一 台 设备 发 送 一 个 适当 的 
向 量 编号 给 处 理 器 。 

图 3-37 中 显示 了 Pentium 处 理 器 的 状态 寄存 器 ， 
在 intel 文献 中 称 为 EFLAGS。 图 4-16 显 示 的 是 这 个 i 
寄存 器 的 第 8 位 到 第 15 位 ， 包 括 中 断 允 许 标志 (F), 图 4-16 Pentin 处 理 器 状态 夺 存 吕 的 一部分 
陷阱 标志 (TF) 和 1/O 优 先 级 (IOPL)。 当 TF=1 时 ，INTR 中 断 将 被 接受 。 陷 阱 标志 允许 在 每 一 条 
指令 后 产生 跟踪 中 断 。 

Pentium 处 理 器 的 优先 级 结构 非常 复杂 ， 操 作 系统 的 不 同 部 分 在 四 个 优先 级 下 分 别 执行 
四 个 优先 级 分 别 占用 处 理 器 地 址 空间 的 不 同 区 段 。 从 一 个 优先 级 转换 到 另 一 个 优先 级 需要 经 过 门 
机 制 的 一 系列 检查 。 这 样 构建 的 0S 是 高 度 安全 的 。 此 外 ， 处 理 器 也 可 以 在 一 个 简单 的 模式 下 
运行 ， 在 这 个 模式 中 没有 优先 级 ， 所 有 程序 运行 在 同一 区 域 中 。 在 这 里 我 们 只 讨论 这 种 简单 的 
模式 。 

当 接 收 到 一 个 中 上 断 请 求 或 发 生 一 个 异常 时 ， 处 理 器 将 执行 以 下 操作 : 

1. 将 处 理 器 状态 寄存 器 、 当 前 段 寄存 器 (CS) 和 指令 指针 (EIP) 压 入 到 处 理 器 堆栈 中 ， 处 
理 器 堆栈 指针 (ESP) 指向 该 堆栈 。 

2. 如 果 异 常 是 由 不 正常 的 执行 状态 引起 的 ， 处 理 器 还 要 将 描述 异常 原因 的 代码 压 人 到 堆 
栈 中 。 

3. 需要 的 话 ， 处 理 器 将 清除 相应 的 中 断 允 许 标志 以 禁止 来 自 同一 中 断 源 的 更 多 中 断 。 

4. 根据 该 中 断 的 向 最 编号 从 中 断 向 量 表 中 取出 中 断 服务 程序 的 起 始 地 址 ， 并 将 它 装 入 到 EIP 
中 ， 然 后 继续 执行 。 

在 处 理 完 中 断 请 求 后 ， 例 如 传送 输入 或 输出 数据 ， 中 断 服务 程序 使 用 中 断 返 回 指令 了 RET 返 
回 被 中 断 的 程序 。 该 指令 将 EIP、CS 和 处 理 器 状态 寄存 器 从 堆栈 中 弹出 到 相应 的 寄存 器 中 ， 恢 复 
处 理 器 的 状态 。 

在 子 程序 情况 下 ， 中 断 服务 程序 可 以 创建 临时 工作 空间 ， 用 来 保存 寄存 器 或 对 局 部 变量 使 用 
的 堆栈 结构 。 但 它 必须 在 执行 IRET 指 令 之 前 恢复 所 有 被 保存 的 寄存 器 ， 并 确保 堆栈 指针 ESP 是 指 
向 返回 地 址 的 。 
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例 4.6 ”图 4-17 显 示 的 是 图 4-9 中 程序 对 Pentium 的 重 写 。 假 定 键盘 发 送 的 中 断 请 求 向 量 编号 为 
32， 并 且 中 断 服 务 程序 的 起 始 地 址 READ 已 经 装 入 到 中 断 向 量 表 相应 的 人口 地 址 处 。 使 用 STI 指 
令 将 处 理 器 状态 寄存 器 中 的 下 标志 位 置 1， 使 处 理 器 允许 中 断 。 
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MOV EOLO 

MOV BL.4 

OR  CONTROL,BL 设 性 KEN 允 许 键 盘 中 断 

STI IR RACIE KE Ar fF as rh RHI pRa 


中 断 服务 程序 


READ EAX 保存 寄存 器 EAX 到 堆栈 中 
EBX 保存 寄存 器 EBX 到 堆栈 中 
EAX,PNTR 载 人 地 址 指针 
BL.DATAIN 获取 输入 字符 
[EAX],BL 存储 字符 
DWORDPTR[EAX] 增加 PNTR 
BL.ODH 检查 字符 是 否 为 CR 
RTRN 
BL.4 
CONTROL,BL 清除 KEN 位 
EOL,1 it REOL RG 
EBX 恢复 寄存 器 EBX 
EAX 恢复 寄存 器 EAX 





图 4-17 在 IA-32 处 理 器 中 ， 从 键盘 读 人 一 行 输入 的 中 断 服务 程序 


44 直接 存储 器 访问 


在 前 面 的 章节 中 我 们 主要 讲述 的 是 处 理 器 和 LO 设备 之 间 的 数据 传输 。 这 些 数据 是 通过 执行 
指令 完成 传输 的 ， 如 指令 : 
Move DAIAIN, RO 


传递 输入 或 输出 数据 的 指令 只 有 在 处 理 器 确定 WO 设备 准备 就 绪 时 才能 执行 。 处 理 器 通过 查询 设 
备 接口 的 状态 标志 ， 或 等 待 设备 发 送 中 断 请 求 来 确定 设备 是 否 就 绪 。 但 是 这 两 种 方式 都 会 导致 相 
当 大 的 开销 ， 因 为 每 传递 一 个 字 大 小 的 数据 必须 执行 好 几 条 程序 指令 。 除 了 查询 设备 的 状态 寄存 
器 以 外 ， 还 需要 使 用 指令 来 增加 存储 器 地 址 和 记录 字数 。 当 使 用 中 断 时 ， 保 存 和 恢复 程序 计数 器 
和 其 他 状态 信息 也 会 产生 额外 的 开销 。 

为 了 高 速 传输 大 量 的 数据 ， 可 采用 另 一 种 可 行 的 方法 。 该 方法 提供 了 一 个 专门 的 控制 单元 ， 
使 一 块 数据 可 以 直接 在 外 部 设备 和 主 存 之 间 传 输 ， 而 不 需要 处 理 器 做 连续 干预 。 这 种 方法 称 为 直 
接 存 储 器 访问 (DMA). 

DMA 传 输 由 IO 设备 接口 中 的 控制 电路 来 执行 。 我 们 将 这 种 电路 称 为 DMA 控 制 器 。 访 问 主 存 
时 ，DMA 控 制 器 执行 一 般 由 处 理 器 执行 的 功能 。 对 每 一 个 传输 的 字 ， 它 提供 存储 器 地 址 和 所 有 
控制 数据 传输 的 总 线 信号 。 因 为 必须 传输 大 量 的 数据 ，DMA 控 制 器 必须 为 连续 的 字 增 加 存储 器 
地 址 并 累计 已 传输 的 字数 。 

虽然 DMA 控 制 器 不 需要 处 理 器 的 参与 就 可 以 传输 数据 ,但 它 的 操作 必须 由 处 理 器 执行 的 程 
序 所 控制 。 为 了 初始 化 一 个 字 块 的 传输 ， 处 理 器 必须 向 它 发 送 起 始 地 址 、 块 内 字数 和 传输 方向 等 
信息 。 接 收 到 这 些 信息 后 ，DMA 控 制 器 就 开始 执行 所 请 求 的 操作 。 当 整 块 数据 传输 完成 后 ， 控 
制 器 产生 一 个 中 断 信 号 通知 处 理 器 。 
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在 PMA 执行 传输 时 ， 请 求 传输 的 程序 被 中 断 ， 处 理 器 可 以 执行 其 他 的 程序 。DMA 传 输 完成 
后 ， 处 理 器 可 以 返回 到 请 求 这 次 传输 的 程序 中 。 

IO 操作 总 是 在 计算 机 操作 系统 响应 应 用 程序 的 请 求 时 才 被 执行 的 。 而 且 ，OS 也 负责 管理 中 
断 正 在 执行 的 程序 和 启动 另 -一 个 程序 。 因 此 ， 对 于 一 次 包含 DMA 的 IO 操作 ，OS 首 先 将 请 求 传输 
的 程序 设置 为 阻塞 状态 ( 见 4.2.6 节 )， 启 动 DMA 操 作 ， 然 后 开始 执行 另 一 程序 。 当 传输 完成 后 ， 
DMA 控 制 器 发 送 一 个 中 断 请 求 通知 处 理 器 。 然 后 OS 进行 响应 ， 将 被 中 断 的 程序 置 为 就 结 状态 ， 
使 得 它 可 以 被 调度 程序 选 定 继续 执行 。 


图 4-18 显 示 了 一 个 DMA 控 制 器 的 寄存 器 ， 处 理 器 访问 该 寄存 器 来 初始 化 传输 操作 。 其 中 两 个 


存储 器 用 来 存储 起 始 地址 和 字数 。 第 三 个 寄存 器 保存 着 状态 和 控制 标志 。R/ 下 位 决定 传输 的 方向 。 
当 它 被 程序 指令 置 1 时 ， 控 制 器 执行 读 操作 ， 即 将 数据 从 存储 器 传输 到 MO 设备 。 否 则 ， 控 制 器 执 
行 写 操作 。 当 控制 器 传输 完 一 块 数据 并 准备 好 接收 另 一 个 命令 时 ， 将 Done 标 志 置 1。 第 30 位 是 中 
断 允 许 标志 一 。 当 这 个 标志 被 置 1 时 ， 控 制 器 在 传输 完 一 块 数据 后 将 产生 一 个 中 断 。 最 后 ， 在 请 求 
中 断后 控制 器 将 RRQ 位 置 1。 l 
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图 4-18 DMA 接 口中 的 寄存 器 


图 4-19 是 一 个 计算 机 系统 的 例子 ， 它 显示 了 如 何 使 用 DMA 控 制 器 。 其 中 一 个 DMA 控 制 器 将 
高 速 网 络 连接 到 计算 机 总 线 上 。 磁 盘 控制 器 控制 两 个 磁盘 ， 同 时 具有 DMA 功 能 ， 提 供 两 个 DMA 
通道 。 它 能 够 执行 两 个 独立 的 DMA 操 作 ， 就 像 每 个 磁盘 都 有 自己 的 DMA 控 制 器 一 样 。 它 有 双 份 
寄存 器 来 存放 存储 器 地 址 、 字 数 等 信息 ， 因 此 每 台 设备 可 以 使 用 一 套 。 

要 启动 一 次 DMA 传 输 ， 将 一 块 数据 从 主 存 传送 到 其 中 一 个 磁盘 ， 程 序 需要 将 地 址 和 字数 信 
息 写 人 到 磁盘 控制 器 相应 通道 的 寄存 器 中 ， 还 要 向 磁盘 控制 器 提供 将 来 检索 要 用 到 的 识别 数据 。 
DMA 控 制 器 独立 执行 指定 的 操作 。 当 DMA 传 输 完成 后 ， 通 过 设置 Done 位 在 DMA 通 道 的 状态 和 控 
制 寄 存 器 中 记录 该 事件 。 同 时 ， 如 果 焉 位 被 置 位 ， 控 制 器 将 发 送 一 个 中 断 请 求 到 处 理 器 并 设置 
IRQ 位 。 状 态 寄 存 器 也 可 以 用 来 记录 其 他 信息 ， 比 如 传输 是 正确 的 还 是 错误 的 。 

处 理 器 和 DMA 对 存储 器 的 访问 可 以 交织 进行 。 在 这 种 方式 中 ，DMA 设 备 请 求 使 用 总 线 的 优 
先 级 要 高 于 处 理 器 。 在 不 同 的 DMA 设 备 中 ， 最 高 优先 级 分 配给 了 高 速 外 围 设备 ， 如 磁盘 、 高 束 
网 络 接口 或 图 形 显示 设备 。 因 为 处 理 器 占用 了 存储 器 大 部 分 的 访问 周期 ， 所 以 认为 DMA 控 制 器 
“窃取 ”了 处 理 器 的 存储 器 访问 周期 。 因 此 ， 这 种 交织 技术 通常 称 为 周期 窃取 (cycle stealing) 技 
术 。 除 这 种 方式 外 ， 还 可 以 给 DMA 控 制 器 一 个 专门 的 访问 主 存 周期 ， 使 它 可 以 不 被 中 断 地 传输 
一 块 数据 。 这 种 方式 称 为 块 或 脉冲 模式 。 
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图 4-19 PMA 控制 器 在 计算 机 系统 中 的 使 用 


大 部 分 DMA 控 制 器 中 都 有 一 个 数据 存储 缓冲 区 。 例 如 ， 在 图 4-19 的 网 络 接口 中 ，DMA 控 制 
器 从 主 存 中 读 出 一 块 数据 并 存储 到 它 的 输入 缓冲 区 中 。 该 传输 使 用 脉冲 模式 ， 传 输 的 速度 既 适 合 
于 存储 器 也 适合 于 计算 机 总 线 。 因 此 ， 缓 冲 区 的 数据 用 网 络 速度 在 网 络 上 发 送 。 

如 果 处 理 器 和 一 个 DMA 控 制 器 或 两 个 DMA 控 制 器 同时 都 要 使 用 总 线 访问 主 存 , 就 会 产生 冲突 。 
为 了 解决 这 些 冲 突 ， 在 总 线 上 提供 有 一 个 仲裁 程序 来 协调 所 有 请 求 存储 器 传送 的 设备 的 活动 。 


总 线 仲 裁 


在 任何 时 候 被 允许 在 总 线 上 启动 数据 传输 的 设备 称 为 总 线 主 控 器 。 在 当前 主 控 器 放弃 对 总 线 
控制 时 ， 另 一 设备 可 以 获得 对 总 线 的 控制 权 。 总 线 仲裁 就 是 选择 下 一 个 成 为 总 线 主 控 器 的 设备 并 
将 主 控 权 传递 给 它 的 进程 。 总 线 主 控 器 的 选择 必须 考虑 各 种 设备 的 需求 ， 这 可 以 通过 建立 一 个 访 
问 总 线 的 优先 级 系统 来 实现 。 

现 有 的 总 线 仲裁 方法 有 两 种 :集中 式 和 分 布 式 。 在 集中 式 仲裁 中 ， 只 有 单个 总 线 仲 纺 器 执行 
仲裁 。 在 分 布 式 仲 裁 中 ， 所 有 设备 都 参与 下 一 个 总 线 主 控 器 的 选择 。 

集中 式 仲裁 

在 这 种 方式 中 ， 总 线 仲裁 器 可 以 是 处 理 器 或 一 个 连接 到 总 线 上 的 独立 单元 。 图 4-20 显 示 了 一 
种 基本 结构 ， 总 线 仲 裁 电路 包含 在 处 理 器 中 。 在 这 种 结构 中 ， 处 理 器 通常 是 总 线 主 控 器 ， 除 非 
它 将 总 线 主 控 权 授予 其 中 一 个 DMA 控 制 器 。DMA 控 制 器 通过 激活 总 线 请 求 线 BR ， 来 表示 它 需 
要 成 为 总 线 主 控 器 。 这 条 线 是 漏 极 开路 式 的 ， 和 图 4-6 中 中 断 请 求 线 原理 相同 。 总 线 请 求 线 上 的 
信号 是 所 有 与 之 相连 设备 的 总 线 请 求 的 逻辑 “或 "。 当 总 线 请 求 信号 被 激活 时 ， 处 理 器 激活 总 线 
允许 信号 BG1， 指 示 DMA 控 制 器 当 总 线 空 闪 时 它 可 以 使 用 总 线 。 这 个 信号 采用 菊花 链 结构 连接 
到 所 有 DMA 控 制 器 上 。 因 此 ， 如 果 DMA 控 制 器 1 正在 请 求 总 线 ， 它 就 阻塞 这 个 允许 信号 的 传播 。 
否则 ， 它 启动 信号 BG2， 将 允许 信号 传递 给 后 面 的 设备 。 当 前 总 线 主 控 器 通过 激活 另 一 条 集 电极 
开路 线 BBSY ， 向 所 有 设备 表示 它 正 在 使 用 总 线 。 因 此 ， 在 收 到 总 线 允 许 信 号 后 ，DMA 控 制 器 
等 待 BBSY 信 号 变 为 无 效 ， 然 后 获得 总 线 主 控 权 。 同 时 ， 它 又 激活 BBSY 信 和 号 阻塞 其 他 设备 使 
用 总 线 。 
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图 4-20 一 种 使 用 菊花 链 的 简单 总 线 仲 裁 结构 


图 4-21 中 的 时 序 图 显示 了 图 4-20 中 的 设备 在 DMA 控 制 器 2 请 求 总 线 、 获 得 总 线 主 控 权 到 最 后 
释放 总 线 的 过 程 中 发 生 的 事件 顺序 。 在 DMA 控 制 器 2 作为 总 线 主 控 器 期 间 ， 它 可 以 进行 一 次 或 多 
次 数据 传送 操作 ， 这 取决 于 它 是 工作 在 周期 窃取 模式 还 是 脉冲 模式 。 当 它 释 放 总 线 后 ， 处 理 器 重 
新 获得 总 线 主 控 权 。 这 个 图 显示 的 只 是 仲裁 过 程 中 信号 间 的 先后 因果 关系 。 至 于 具体 的 定时 ， 因 
各 计算 机 总 线 的 不 同 而 不 同 ， 所 以 没有 标注 。 


一 一 > 时 间 


BBSY 


总 线 主 控 器 











处 理 器 | | DMA 控 制 器 2 | | 处 理 器 
图 4-21 图 4-20 中 的 设备 在 总 线 主 控 权 传递 过 程 中 的 信号 发 生 顺 序 


图 4-20 显 示 的 是 一 条 总 线 请 求 线 和 一 条 总 线 允 许 线形 成 的 菊花 链 。 在 相似 的 图 4-8b 的 多 中 断 
请 求 结构 中 提供 了 多 个 这 样 的 线 对 。 这 种 结构 使 得 确定 不 同 设备 的 请 求 顺 序 相当 复杂 。 仲 裁 电 路 
根据 预先 确定 的 优先 级 确保 在 任何 时 候 都 只 有 一 个 请 求 被 允许 。 例 如 ， 如 果 有 四 条 总 线 请 求 线 ， 
BR1 色 BR4， 就 可 以 使 用 一 种 固定 优先 级 方式 ，BR1 被 授予 最 高 的 优先 级 ，BR4 被 授予 最 低 的 优 
先 级 。 此 外 ， 也 可 以 使 用 轮转 优先 级 方式 使 所 有 设备 都 有 均等 的 机 会 。 所 谓 轮转 优先 级 ， 就 是 说 
当 BR1 线 上 的 请 求 被 允许 后 ， 优 先 级 顺序 就 变 成 了 2, 3, 4, 1。 

分 布 式 仲裁 

分 布 式 仲裁 指 的 是 在 仲裁 过 程 中 不 使 用 中 心 仲裁 器 ， 所 有 等 待 使 用 总 线 的 设备 有 着 同等 的 机 
会 。 图 4-22 是 一 种 简单 的 分 布 式 仲裁 方案 。 总 线 上 的 每 一 台 设 备 都 分 配 有 一 个 4 位 识别 码 。 当 一 
台 或 多 台 设 备 请 求 总 线 时 ， 它 们 启动 Start- Arbitration 信号 并 将 它们 的 4 位 ID 号 码 放 到 四 条 集 电 
极 开路 线 ARB0 到 ARB3 上。 所 有 竞争 者 发 送 到 这 些 线路 上 的 信号 之 间 相 互 发 生 作用 ， 最 后 的 胜 
出 者 被 选 定 。 最 终 这 四 条 线 组 成 的 代码 代表 有 最 高 ID 号 码 的 请 求 。 

线路 的 驱动 器 是 集 电 极 开路 类 型 的 。 因 此 ， 如 果 一 个 驱动 器 的 输入 等 于 1， 另 一 个 连接 到 
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同一 总 线 的 驱动 器 的 输入 等 于 0， 则 总 线 将 处 于 低 电 平 状态 。 也 就 是 说 ， 是 按 逻 辑 “ 或 ”进行 








图 4-22 一 种 分 布 式 仲裁 方案 


假设 有 两 台 设 备 A 和 B 正 在 请 求 使 用 总 线 ，ID 号 码 分 别 为 5 和 和 6。 设 备 A 发 送 位 序 0101， 设 备 B 
发 送 位 序 0110。 最 终 “或 ”的 结果 是 0111 。 每 台 设 备 从 高 位 开始 和 仲裁 线 上 的 值 比较 。 如 果 它 在 
某 一 位 检测 到 不 一 致 ， 就 在 这 一 位 以 及 所 有 后 继 位 关闭 驱动 器 ， 即 将 这 些 驱 动 器 的 输入 置 0。 在 
该 例 中 ， 设 备 A 在 ARBI 上 检测 到 不 一 致 ， 因 此 禁止 ARBI 和 ARB6 的 驱动 器 ， 从 而 导致 仲裁 线 
上 的 位 序 变 为 0110， 这 意味 着 B 在 竞争 中 获得 了 胜利 。 需 要 注意 的 是 ， 因 为 优先 级 线 上 的 代码 在 
一 个 较 短 的 时 间 内 仍 是 0111， 所 以 设备 B 可 能 暂时 在 ARB0 线 上 关闭 它 的 驱动 器 。 但 是 A 的 操作 
将 会 导致 ARB1 线 变 成 0， 一 旦 B 见 到 ARB1 线 为 0， 它 将 重新 启动 驱动 器 。 

分 布 式 仲裁 具有 较 高 的 可 靠 性 ， 因 为 这 种 总 线 的 操作 不 依赖 于 任何 一 台 单 独 的 设备 。 目 前 ， 还 
有 很 多 其 他 方案 用 来 实现 分 布 式 仲裁 。4.7.2 节 中 将 要 描述 的 SCSI 总 线 就 是 分 布 式 仲裁 的 一 个 例子 。 


4.5 总 线 


处 理 器 、 主 存 和 IO 设备 可 以 通过 公共 总 线 相互 连接 。 公 共 总 线 的 主要 职能 是 为 数据 传输 提 
供 通信 通道 。 它 有 支持 中 断 和 仲裁 所 需要 的 线路 。 在 本 节 中 ， 我 们 讲述 用 于 数据 传输 的 总 线 协 议 
的 主要 特性 。 总 线 协议 是 管理 连接 到 总 线 上 各 设备 的 行为 规则 的 集合 , 如何 时 将 数据 放 到 总 线 上 、 
启动 控制 信号 等 。 描 述 完 总 线 协 议 后 ， 将 给 出 一 些 使 用 这 种 协议 的 接口 电路 的 例子 。 

用 来 传输 数据 的 总 线 线路 可 以 分 为 三 种 类 型 : 数据 线 、 地 址 线 和 控制 线 。 控 制 信号 说 明 是 否 执 
行 读 或 写 操作 。 通 常 ， 使 用 单 根 R/ 页 线 来 传送 控制 信号 ， 当 它 被 置 1 时 表示 进行 读 操 作 、 被 置 O 时 表 
示 进 行 写 操作 。 在 允许 传输 不 同 长 度 的 操作 数 时 ， 如 字 节 、 字 或 长 字 ， 数 据 的 长 度 也 被 显示 出 来 。 

总 线 控制 信号 还 要 传送 时 序 信息 。 这 些 信息 详细 说 明 何 时 处 理 器 和 IO 设备 可 以 将 数据 放 到 
总 线 上 或 从 总 线 上 接收 数据 。 目 前 有 多 种 传输 数据 时 序 的 方式 ， 大 致 可 以 将 它们 分 为 同步 和 异步 
两 种 方式 。 





回顾 4.4.1 节 ， 我 们 知道 在 任何 数据 传输 操作 中 都 有 一 台 设 备 作 为 主 挖 器 。 它 在 总 线 上 发 布 读 
写 命令 、 启 动 数据 传输 ， 因 此 也 可 以 称 作 启动 设备 。 通 常 ， 处 理 器 是 总 线 主 控 器 ， 但 其 他 有 
DMA 功 能 的 设备 也 可 以 成 为 总 线 主 控 器 。 被 主 控 设 备 寻 址 的 设备 称 作 从 动 或 目标 设备 。 


451 同步 总 线 


在 同步 总 线 中 ， 所 有 设备 都 从 一 根 公共 时 钟 线路 上 获取 时 序 信 息 。 这 条 线路 上 相同 间隔 的 脉 
冲 定 义 了 相同 的 时 间 间 隔 。 在 最 简单 的 同步 总 线 中 ， 每 一 个 时 间 间 隔 组 成 一 个 总 线 周 期 ， 一 个 周 
期 内 可 以 进行 一 次 数据 传送 。 图 4-23 举 例 说 明了 这 种 方式 。 在 该 图 及 后 续 图 中 ， 地 址 和 数据 线 同 
时 显示 出 了 高 电 平和 低 电 平 。 用 高 或 低 电 平 表示 是 一 种 通用 的 约定 ， 它 依赖 于 具体 的 地 址 和 数据 
传输 模式 。 交 点 表示 的 是 发 生 了 变化 。 处 于 不 确定 或 高 阻抗 状态 的 单 信号 线路 用 高 低 电 平 之 间 的 
中 间 电 平 来 表示 。 

让 我 们 来 看 一 下 在 一 次 输入 〈 读 ) 操作 期 间 发 生 事件 的 顺序 。 在 时 间 时 ， 总 线 主 控 器 将 设 
备 地 址 放 到 地 址 线 上 并 向 控制 线 发 送 一 条 相应 的 命令 。 如 需要 ， 这 个 命令 还 要 说 明 这 是 一 次 输入 
操作 并 指明 将 要 读 取 操作 数 的 长 度 。 数 据 在 总 线 上 的 传输 速度 取决 于 总 线 的 物理 和 电气 特性 。 时 
钟 脉冲 的 宽度 ~ 必须 大 于 两 台 连 接 到 总 线 上 的 设备 之 间 的 最 大 传播 延迟 。 而 且 ， 该 时 间 要 足 
够 长 来 保证 所 有 设备 对 地 址 和 控制 信号 进行 译 码 ， 从 而 使 得 被 寻 址 设备 《从 动 设备 ) 能 够 在 时 间 
进行 响应 。 此 外 ， 确 保 在 n 前 从 动 设备 不 执行 任何 操作 也 不 将 数据 放 到 总 线 上 同样 十 分 重要 。 
因为 总 线 上 的 信息 在 到 n 期间 是 不 可 靠 的 ， 此 时 信号 正 处 于 改变 状态 。 被 寻 址 的 从 动 设 备 应 在 
时 间 时 将 请 求 的 数据 放 到 数据 总 线 上 。 

时 钟 周期 结束 时 ， 即 在 时 间 . 靖 ， 主 控 设备 选 通 数据 线 上 的 数据 存 入 到 自己 的 输入 缓冲 区 中 。 
在 这 里 ,，“ 选 通 ” 指 的 是 在 特定 时 刻 捕捉 数据 的 值 并 将 它们 存 到 缓冲 区 中 。 要 使 数据 能 够 正确 地 
装 人 到 存储 设备 中 (如 触发 寄存 器 ) ， 数 据 在 存储 设备 输入 端的 有 效 时 间 必 须 大 于 存储 设备 的 准 
条 时 间 ( 见 附录 A)。 因 此 ,， 握 ~ 二 这 段 时 间 必 须 大 于 总 线 上 的 最 大 传输 时 间 与 主 控 设 备 输入 缓冲 
寄存 器 的 准备 时 间 之 和 。 

输出 操作 也 有 类 似 的 过 程 。 主 控 设 备 在 发 送 地 址 和 命令 信息 的 同时 也 将 输出 数据 放置 到 数据 
线 上 。 在 时 间 握 ， 被 寻 址 的 设备 选 通 数据 线 ， 将 数据 装 和 到 自己 的 数据 缓冲 区 中 。 
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图 4-23 中 的 时 序 图 是 总 线 线路 上 发 生动 作 的 一 种 理想 化 表示 。 实 际 中 信号 变换 状态 的 确切 的 
时 间 与 图 中 显示 的 有 些 差别 ， 因 为 在 总 线 线路 和 设备 电路 上 存在 着 传输 延迟 。 图 4-24 给 出 了 一 个 
更 接近 实际 情况 的 图 。 在 这 幅 图 中 除了 时 钟 以 外 ， 每 个 信号 都 显示 了 两 个 图 像 。 因 为 信号 要 花费 
时 间 从 一 台 设 备 传送 到 另 一 台 设 备 ， 所 以 不 同 的 设备 见 到 同一 信号 跳 变 的 时 间 不 同 。 其 中 一 个 显 
示 的 是 主 控 设 备 见 到 的 信号 ， 另 一 个 显示 的 是 从 动 设备 见 到 的 信号 。 我 们 假设 总 线 上 所 有 设备 见 
到 时 钟 变换 的 时 间 相 同 。 系 统 设计 者 需要 花费 相当 大 的 精力 来 确保 时 钟 信号 能 满足 这 一 条 件 。 
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图 4-24 对 应 图 4-23， 更 实际 的 输入 传输 时 序 图 


主 控 设备 在 时 钟 周 期 1 开始 的 上 升 沿 (n) 发 送 地 址 和 命令 信号 。 但 由 于 总 线 驱 动 电路 的 延迟 ， 
在 kw 之 前 ， 这 些 信 号 并 不 出 现在 总 线 上 。 在 4s 时 刻 ， 信 号 到 达 从 动 设备 。 从 动 设备 对 地 址 信和 号 
进行 译 码 ， 并 在 时 间 # 发 送 被 请 求 的 数据 。 同 样 ， 数 据 信号 直到 os 时 刻 才 出 现在 总 线 上 。 它 们 向 
主 控 设备 方向 传输 ， 在 tps 到达。 在 时 间 靖 ， 主 控 设 备 将 数据 装 和 人 到 它 的 输入 缓冲 区 中 。 因 此 ， 
P~ipy 这 段 时 间 是 主 控 设 备 输入 缓冲 区 的 准备 时 间 。 数 据 在 后 必须 保持 有 效 一 段 时 间 ， 这 段 时 
间 等 于 该 缓冲 区 的 保持 时 间 。 

时 序 图 在 文献 中 常常 只 给 出 图 4-23 中 的 简化 图 ， 尤 其 是 在 概括 介绍 数据 是 如 何 传输 时 。 但 实 
际 中 ,信号 总 是 包含 有 图 4-24 所 示 的 延迟 。 

多 周期 传输 

按照 上 面 描述 的 方式 我 们 可 以 得 到 设备 接口 的 一 种 简单 设计 方式 。 但 是 ， 这 种 方式 有 它 的 局 
限 性 。 因 为 每 次 传输 必须 在 一 个 周期 内 完成 ， 时 钟 周期 ~ 必须 满足 最 长 的 时 间 延 迟 和 最 慢 的 
设备 接口 。 这 将 迫使 所 有 设备 都 在 最 慢 设 备 的 速度 下 工作 。 

此 外 ， 处 理 器 也 不 能 确定 被 导 址 设备 是 否 已 经 响应 。 它 只 是 简单 假定 在 时 输出 数据 已 经 被 
WO 设备 接收 ， 或 输入 数据 已 在 数据 线 上 有 效 。 但 如 果 由 于 故障 ， 设 备 没 有 响应 ， 则 无 法 检测 到 
该 错误 。 

为 克服 这 些 局 限 性 ， 大 部 分 总 线 都 有 表示 设备 响应 的 控制 信号 。 这 些 信号 通知 主 控 设备 从 动 





设备 已 经 识别 了 它 的 地 址 并 准备 好 参与 数据 传输 操作 了 。 也 可 以 调整 数据 传输 时 的 脉冲 宽度 来 适 
应 设备 。 为 简化 这 一 过 程 ， 我 们 使 用 高 频 时 钟 信 号 ， 这 样 一 个 完整 的 数据 传送 周期 就 可 能 会 跨越 
好 几 个 时 钟 周期 。 因 此 ， 不 同 设备 传输 数据 所 需 的 时 钟 周期 数 就 有 可 能 不 相同 。 

图 4-25 是 多 时 钟 周期 传输 的 一 个 例子 。 在 时 钟 周期 1 期 间 ， 主 控 设 备 将 地 址 和 命令 信息 发 送 
到 总 线 上 请 求 一 次 读 操 作 。 从 动 设备 接收 到 这 个 信息 并 将 其 译 码 。 在 下 一 个 时 钟 的 上 升 沿 ， 即 时 
钟 周期 2 开始 时 ， 决 定 进 行 响应 并 开始 访问 被 请 求 的 数据 。 我 们 已 经 假设 在 获取 数据 的 过 程 中 存 
在 一 些 延 迟 ， 所 以 从 动 设备 并 不 能 立即 响应 。 在 时 钟 周期 3 数据 被 准备 好 并 放 到 总 线 上 。 同 时 ， 
从 动 设备 启动 从 动 就 绪 控制 信号 。 等 待 这 个 信号 的 主 控 设 备 在 时 钟 周期 3 结束 时 选 通 数据 到 它 的 
输入 缓冲 区 中 。 至 此 总 线 传送 操作 完成 ， 主 控 设 备 可 以 在 时 钟 周期 4 发 送 一 个 新 的 地 址 并 启动 下 
一 次 新 的 传送 。 

从 动 就 绪 信 号 是 从 动 设备 对 主 控 设 备 的 应 答 ， 它 确认 有 效 数据 已 经 被 发 送 了 。 在 图 4-25 中 ， 
从 动 设备 在 周期 3 响应 。 其 他 设备 响应 的 时 间 可 能 会 早 一 些 或 晚 一 些 。 从 动 就 绪 信 号 使 得 不 同 设 
备 的 总 线 传输 脉冲 宽度 可 以 不 同 。 如 果 被 访问 的 设备 根本 不 响应 ， 主 挖 设备 等 待 预先 确定 的 最 大 
时 钟 周期 数 后 就 放弃 这 次 操作 。 这 可 能 是 由 于 地 址 错误 或 设备 故障 导致 的 。 
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图 4-25 多 时 钟 周期 的 输入 传输 


需要 注意 的 是 计算 机 总 线 上 使 用 的 时 钟 信号 并 不 需要 与 处 理 器 的 时 钟 相同 。 后 者 通常 要 快 得 
多 ， 因 为 它 是 控制 处 理 器 芯片 的 内 部 操作 的 。 例 如 ， 将 信号 输入 到 芯片 中 遇 到 的 延迟 要 远 小 于 在 
连 楼 印刷 电路 板 上 芯片 的 总 线 时 遇 到 的 延迟 。 时 钟 频率 是 高 度 依赖 于 技术 的 ， 在 现代 的 处 理 器 芯 
片 中 ， 一 般 都 超过 500MHz。 而 在 存储 器 和 IO 总 线 中 ， 时 钟 频率 可 能 在 $0 到 150 MHz 的 范围 内 。 

许多 计算 机 总 线 ， 如 Pentium 和 ARM 处 理 器 总 线 ， 使 用 与 图 4-25 相 似 的 方式 控制 数据 传输 。 
4.7.1 节 将 要 描述 的 PCI 总 线 标准 也 与 图 4-25 十 分 相似 。 接 下 来 我 们 将 讲述 一 种 根本 不 使 用 时 钟 信 
号 的 方法 。 


4.5.2 异步 总 线 
控制 总 线 上 数据 传输 的 另 一 种 方式 是 基于 主 控 设备 和 从 动 设备 之 间 的 握手 信号 。“ 担 手 ” 的 概 
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念 是 图 4-25 中 从 动 就 绪 信号 概念 的 省 化 。 公 共 时 钟 被 两 根 定 时 控制 线 取 代 ， 分 别 是 主 控 就 绪 和 从 
动 就 绪 。 第 一 根 控制 线 由 主 控 设 备 启动 表示 它 已 经 准备 好 一 次 事务 ， 第 二 根 则 是 从 动 设备 的 响应 。 

原理 上 ， 提 和 手 协 议 控制 的 数据 传送 按照 如 下 步骤 进行 。 主 控 设 备 将 地 址 和 命令 信息 放 到 总 线 
上 。 然 后 ， 激 活 主 控 就 绪 线 通知 所 有 设备 已 经 将 地 址 和 命令 信息 放 到 总 线 上 了 。 总 线 上 所 有 设备 
对 该 地 址 进行 译 码 。 被 选 定 的 设备 执行 请 求 操作 ， 并 激活 从 动 就 绪 线 通知 处 理 器 它 已 经 准备 好 。 
主 控 设 备 等 待 从 动 就 绪 线 有 效 后 ， 将 自己 的 信号 从 总 线 上 撤销 。 在 读 操作 中 ， 还 需要 将 选 通 数据 
存 人 到 输入 缓冲 区 中 。 

图 4-26 是 一 个 基于 握手 方式 的 输入 数据 传输 操作 的 时 序 ， 它 描述 了 如 下 的 事件 顺序 : 

0 一 一 主 挖 设备 将 地 址 和 命令 信息 放 到 总 线 上 上 ， 总 线 上 所 有 设备 开始 对 该 信息 进行 译 码 。 

一 一 主 控 设 备 将 主 控 就 绪 线 置 1， 通 知 所 有 1/O 设 备 地 址 和 命令 信息 已 经 放 到 总 线 上 了 。1~io 
的 延迟 用 来 补偿 总 线 上 出 现 的 相位 偏 移 。 当 同一 信号 源 同时 发 送 的 两 个 信号 不 同时 到 达 目 的 地 时 ， 
就 会 出 现 相 位 偏 移 。 这 是 由 总 线 中 不 同 线路 的 传播 速度 不 同 导致 的 。 因 此 ， 为 了 保证 主 控 就 绪 信 
号 不 在 地 址 和 命令 信息 之 前 到 达 设 备 ， 延 迟 ~ 应 该 大 于 最 大 的 总 线 相位 偏 移 。( 注 意 :在 同步 
情形 中 ， 总 线 相 位 偏 移 是 最 大 传播 延迟 的 一 部 分 .) 当地 址 信息 到 达 设 备 时 ， 接 口 电路 都 对 它们 
进行 译 码 。 要 保证 有 足够 的 时 间 进 行 地 址 译 码 ， 该 延迟 也 应 该 包含 在 ~ 内 。 

2 一 一 被 选 定 的 从 动 设备 在 对 地 址 和 命令 信息 译 码 后 ， 将 它 数据 寄存 器 中 的 数据 放 到 数据 线 
上 执行 请 求 的 输入 操作 。 同 时 ， 将 从 动 就 绪 信 号 置 !。 如 果 在 数据 放 到 总 线 之 前 接口 电路 产生 了 
额外 延迟 ， 从 动 设备 必须 相应 地 延迟 从 动 就 绪 信 号 。t ~ n 这 段 时 间 的 大 小 依赖 于 主 控 设 备 和 从 
动 设备 之 间 的 距离 以 及 从 动 设 备 电路 产生 的 延迟 。 总 线 异步 的 特性 就 体现 在 该 段 延迟 时 间 的 可 
变性 上 。 

三 一 一 从 动 就 绪 信号 到 达 主 控 设 备 ， 表 示 输 入 数据 已 经 在 总 线 上 上 可用。 不 过 ， 因 为 我 们 假定 
设备 接口 在 发 送 从 动 就 绪 信号 的 同时 将 数据 放置 到 总 线 上 , 所 以 主 控 设备 应 该 允许 总 线 相位 偏 移 。 
此 外 ， 还 必须 允许 输入 缓冲 区 所 需 的 准备 时 间 。 在 延迟 最 大 总 线 相位 偏 移 和 最 小 准备 时 间 后 ， 主 
控 设备 选 通 数据 到 它 的 输入 缓冲 区 ， 同 时 撤销 主 控 就 绪 信 号 ， 表 示 它 已 经 收 到 数据 。 

一 一 主 控 设 备 从 总 线 上 撤销 地 址 和 命令 信息 。& 与 is 之 间 的 延迟 也 是 用 来 补偿 总 线 相位 仿 
移 的 。 因 为 如 果 设 备 在 总 线 上 见 到 的 地 址 发 生变 化 ， 主 控 就 绪 信号 仍然 等 于 1 就 会 产生 错误 的 
寻 址 。 

6 一 当 设备 接口 收 到 主 控 就 绪 信号 从 1 到 0 的 跳 变 后， 就 从 总 线 上 撤销 数据 和 从 动 就 绪 信号 。 
此 时 输入 传输 结束 。 

图 4-27 显 示 的 是 输出 操作 的 时 序 ， 实 质 上 与 输入 操作 相同 。 在 输出 操作 中 ， 主 控 设 备 在 将 输 
出 数据 放置 到 数据 线 的 同时 发 送 地 址 和 命令 信息 。 选 定 的 从 动 设备 收 到 主 控 就 绪 信号 后 选 通 数据 
到 它 的 输出 缓冲 区 ， 并 将 从 动 就 绪 信号 置 1 表示 它 已 经 接收 到 数据 了 。 这 个 周期 的 其 余部 分 与 输 
入 操作 相同 。 

在 图 4-26 和 图 4-27 的 时 序 图 中 ， 我 们 很 设 主 控 设备 将 补偿 总 线 相位 偏 移 和 地 址 译 码 延迟 ， 引 
AT on 段 和 己 至 4 段 的 延 迟 。 如 果 这 些 延迟 能 够 提供 足够 的 时 间 给 YO 接口 译 码 地 址 ， 接 口 电 
路 就 可 以 直接 用 主 控 就 绪 信 号 来 控制 发 送 给 或 来 自 总 线 的 信号 ， 这 一 点 在 学 习 下 一 节 的 接口 电路 
示例 时 会 更 加 清楚 。 

图 4-26 和 图 4-27 中 的 担 手 信号 是 完全 互 锁 的 。 一 个 信号 状态 的 改变 将 会 导致 另 一 个 信号 状态 
的 改变 。 因 此 这 种 方式 称 为 完全 握手 方式 。 它 提供 了 最 高 程度 的 灵活 性 和 可 靠 性 。 
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4.5.3 讨论 


在 商业 计算 机 让 使 用 了 许多 上 述 类 似 的 总 线 技术 。 例 如 ，68000 系 列 处 理 器 中 的 总 线 就 有 两 
种 工作 模式 一 一 同步 和 异步。 具体 设计 的 选择 需要 权衡 如 下 因素 : 

“接口 电路 的 简单 性 。 

“适应 不 同 延 迟 的 设备 接口 的 能 力 。 

“总线 传 输 需要 的 总 时 间 。 

“检测 由 于 寻 址 不 存在 的 设备 或 接口 故障 所 导致 的 错误 的 能 力 。 

异步 总 线 的 主要 优点 是 握手 过 程 中 不 需要 同步 发 送 者 和 接收 者 的 时 钟 , 从 而 简化 了 时 序 设 计 。 
接口 电路 或 总 线 线路 上 传播 过 程 中 产生 的 延迟 都 可 以 很 容易 解决 。 当 这 些 延 迟 改变 时 ， 例 如 在 增 
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加 或 删除 一 个 接口 电路 时 由 于 负载 的 变化 导致 的 延迟 变化 ， 数 据 传输 的 时 序 可 以 自动 根据 新 情况 
进行 调整 。 而 对 于 同步 总 线 ， 时 钟 电路 必须 仔细 设计 以 确保 正确 的 同步 ， 并 且 延 迟 也 必须 严格 控 
制 在 一 定 范围 之 内 。 

由 完全 握手 方式 控制 的 异步 总 线 上 的 数据 传送 ， 由 于 每 一 次 传送 都 要 包括 两 个 来 回 的 延迟 
《四 个 端 到 端的 延迟 )， 所 以 传输 速率 受到 很 大 的 限制 。 从 图 4-26 和 图 4-27 中 我 们 可 以 很 容易 看 出 ， 
从 动 就 绪 信 号 必须 等 到 主 控 就 绪 信 号 的 跳 变 到 达 后 才能 跳 变 ， 反 之 亦 然 。 在 同步 总 线 中 ， 时 钟 
周期 只 需 满足 一 个 端 到 端的 传播 延迟 即 可 。 因 此 ， 同 步 总 线 可 以 得 到 更 高 的 传输 速率 。 如 前 面 
所 述 ， 为 了 适应 较 慢 的 设备 还 使 用 了 附加 的 时 钟 周 期 。 今 天 我 们 使 用 大 部 分 的 高 速 总 线 都 是 使 
用 同步 方法 。 


4.6 接口 电路 


接口 是 由 将 IO 设备 连接 到 计算 机 总 线 上 的 电路 组 成 的 。 在 接口 的 一 侧 有 总 线 地 址 信号 、 数 
据 信号 和 控制 信号 。 在 另 一 侧 有 一 条 数据 通路 ， 该 通路 和 它 相关 的 控制 器 一 起 负责 接口 与 JO 设 
备 之 间 的 数据 传输 ， 这 一 侧 称 为 痛 口 ， 可 以 分 成 并 行 和 串 行 两 类 。 并 行 端口 每 次 可 以 同时 传输 多 
位 数据 ， 一 般 为 8 位 或 1 位。 而 串 行 接口 每 次 只 能 发 送 或 接收 1 位 数据 。 总 线 上 的 通信 对 于 两 种 方 
式 都 是 一 样 的 ， 并 行 和 趾 行 之 间 的 转换 在 接口 电路 中 完成 。 

在 并 行 端口 中 ， 设 备 和 计算 机 之 间 通 过 多 引 脚 连接 器 和 有 多 条 电线 的 电缆 连接， 一 般 排 列 成 
平板 结构 。 两 端的 电路 相对 简单 些 ， 因 为 这 里 不 需要 进行 并 行 和 串 行 转换 。 这 种 结构 只 适用 于 物 
理 上 与 计算 机 相近 的 设备 。 对 于 较 长 的 距离 ， 前 面 提 到 的 时 序 相 位 偏 移 问题 就 会 限制 可 用 的 数据 
传输 速率 。 在 一 些 需要 更 长 电缆 的 地 方 ， 串 行 方式 要 方便 和 有 效 得 多 。 串 行 传输 形式 将 在 第 10 章 
中 讲述 。 

在 讲述 具体 的 接口 电路 之 前 ， 首 先 复习 一 下 接口 电路 的 功能 。 根 据 4.1 节 的 内 容 ，1/O 接 口 : 

1. 提供 至 少 一 个 数据 字 的 存储 缓冲 空间 (或 一 个 字 节 ， 在 面向 字 节 的 设备 中 )。 

2. 包含 状态 标志 ， 处 理 器 通过 访问 该 状态 标志 确定 缓冲 区 是 否 已 满 (对 输入 ) 或 已 空 (对 
输出 )。 

3. 包含 地 址 译 码 电路 以 确定 何 时 被 处 理 器 寻 址 。 

4. 产生 总 线 控制 所 需要 的 定时 信号 。 

5. 执行 所 有 在 总 线 和 W/O 设备 之 间 传 送 数据 所 需 的 格式 转换 ， 如 申 行 端口 下 的 并 / 申 转 换 。 


4.6.1 并 行 端口 


现在 我 们 用 一 个 实际 例子 给 大 家 解释 一 下 接口 设计 的 主要 内 容 。 首 先 ， 描 述 一 下 分 别 用 于 8 
位 输入 端口 和 8 位 输出 端口 的 电路 。 然 后 ， 将 这 两 种 电路 结合 起 来 介绍 如 何 设 计 一 个 通用 8 位 并 
行 端口 的 接口 。 假 定 这 个 接口 是 连接 到 一 个 32 位 处 理 器 上 的 ， 该 处 理 器 使 用 存储 器 映射 /0 寻 址 
以 及 图 4-26 与 图 4-27 所 描述 的 异步 总 线 协 议 。 最 后 介绍 如 何 修改 该 设计 使 它 适 应 图 4-25 中 的 总 线 
协议 。 : 

图 4-28 显 示 了 将 一 个 键盘 连接 到 处 理 器 所 需要 的 硬 部 件 。 一 般 的 键盘 由 机 械 开关 组 成 ， 这 些 
开关 通常 是 断 开 的 。 当 一 个 键 被 按 下 时 ， 它 的 开关 闭合 形成 一 条 电信 号 通路 。 该 信号 可 以 被 编码 
器 电路 检测 到 然后 产生 相应 字符 的 ASCH 代 码 。 这 种 按钮 开关 的 一 个 难点 是 当 一 个 键 被 按 下 后 的 
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接触 反弹 。 即 使 反弹 只 持续 1~2 毫 秒 ， 这 也 足以 使 计算 机 将 一 次 按键 行为 监测 为 几 次 不 同 的 电气 
事件 。 这 个 单 次 按键 行为 将 被 错误 地 认为 是 已 经 快速 地 按 下 和 松 开 了 多 次 ， 所 以 必须 消除 反弹 的 
副作用 。 这 里 有 两 种 方法 可 以 解决 该 问题 : 使 用 一 个 简单 的 消除 反弹 电路 ， 或 是 使 用 软件 。 当 采 
用 软件 方法 来 消除 反弹 时 ，UO 程 序 从 键盘 读 人 一 个 字符 后 等 待 足够 长 的 时 间 来 确保 反弹 已 经 结 
束 。 图 4-28 所 示 的 是 硬件 方法 ， 消 除 反弹 的 电路 包括 在 编码 器 模块 中 。 





图 4-28 键盘 与 处 理 器 的 连接 


编码 器 的 输出 由 表示 编码 字符 的 位 序 和 一 个 有 效 (Valid) 控制 信号 组 成 ， 该 控制 信号 表示 -- 
个 键 正 被 按 下 。 将 这 些 信息 发 送 到 接口 电路 上 ， 接 口 电路 中 有 一 个 数据 寄存 器 DATAIN 和 一 个 状 
态 标志 SIN。 当 一 个 键 被 按 下 时 ， 有 效 信 号 从 0 变 为 1， 并 将 ASCII 码 装 入 DATAIN， 同 时 将 SIN 置 1。 
处 理 器 读 取 DATAIN 寄 存 器 的 内 容 后 状态 标志 SIN 清 0。 这 个 接口 电路 与 一 条 异步 总 线 相 连 ， 该 总 
线 使 用 图 4-26 的 握手 信号 “ 主 控 就 绪 ” 和 “从 动 就 结 ” 控 制 传输 ， 此 外 还 有 第 三 根 控制 线 R/ W JH 
来 区 分 读 写 传输 。 

图 4-29 是 一 个 输入 接口 电路 。DATAIN 寄 存 器 的 输出 线 通 过 三 态 驱 动 器 连接 到 总 线 的 数据 线 上 ， 
当 处 理 器 发 出 包含 有 该 寄 存 器 地 址 的 读 指令 时 ， 三 态 驱 动 器 被 打开 。SIN 信 号 由 状态 标志 电路 产生 ， 
也 通过 三 态 驱 动 器 发 送 到 总 线 上 。SIN 与 位 DO 相连 ， 也 就 是 说 它 将 作为 状态 寄存 器 的 第 0 位 ， 状 态 
寄存 器 的 其 他 位 不 包含 有 效 的 信息 。 当 地 址 的 高 31 位 与 分 配给 这 个 接口 的 任 一 地 址 相符 时 ， 由 地 
址 译 码 器 选 定 该 输 入 接口 。 在 主 控 就 绪 信 号 有 效 时 ， 地 址 A0 位 决定 是 读 取 状态 寄存 器 还 是 数据 寄 ” [245 
存 器 。 在 读 取 状态 信号 或 读 取 数 据 信号 等 于 1 时 ， 提 手 控制 通过 激活 从 动 就 绪 信 号 来 完成 。 

图 4-30 是 状态 标志 电路 的 一 种 可 行 实现 方案 。 图 中 边缘 触发 的 D 触 发 器 将 被 有 效 信号 线 上 的 
上 升 沿 置 !，NOR 锁 存 器 的 状态 也 将 跟着 改变 ， 从 而 SIN 被 置 !。 在 SIN 被 处 理 器 读 取 的 时 候 ， 锁 
存 器 的 状态 不 允许 改变 。 因 此 ， 该 电路 就 可 以 确保 只 有 当主 控 就 绪 信号 等 于 0 时 才 可 以 对 SIN 进 行 
设置 。 当 读 取 数 据 信号 被 置 1， 读 取 DATAIN 寄 存 器 时 ， 和 触发 器 和 锁 存 器 都 被 重 置 成 0。 

现在 让 我 们 再 来 看 一 个 可 以 用 来 将 输出 设备 (比如 打印 机 ) 连接 到 处 理 器 的 输出 接口 ， 如 图 
4-31 所 示 。 打 印 机 在 所 和 手 信和 号“ 有效” 和 “闲置 ”的 控制 下 工作 ， 控 制 方式 与 总 线 上 使 用 主 挖 就 
绪 和 从 动 就 绪 信 号 的 握手 方式 相似 。 当 准备 好 接收 一 个 字符 时 ， 打 印 机 启动 它 的 闲置 信号 ， 然 后 
接口 电路 将 一 个 新 字符 放置 到 数据 线 上 并 激 医 有 效 信号 。 打 印 机 进行 响应 ， 打 印 -个 新 字符 并 取 
消闲 置信 号 ， 接 口 电 路 也 紧 接 着 撤销 有 效 信号 。 

接口 中 有 一 个 数据 寄存 器 DATAOUT 和 一 个 状态 标志 SOUT。SOUT 标 志 在 打印 机 准备 好 接收 
另 一 个 字符 时 被 置 1， 当 处 理 器 将 一 个 新 字符 装 入 到 DATAOUT 后 被 清 0。 图 4-32 显 示 了 这 种 接 品 
的 一 种 实现 。 它 的 操作 与 图 4-29 中 的 输入 接口 相似 。 惟 一 显著 的 区 别 是 握手 控制 电路 ， 具 体 的 设 B 
计 作 为 一 个 练习 留 给 读者 。 
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图 4-30 图 4-29 中 状态 标志 模块 的 电路 
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打印 机 





图 4-31 打印 机 与 处 理 器 的 连接 
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图 4-32 输出 接口 电路 


上 面 讲述 的 输入 和 输出 接口 可 以 结合 成 为 一 个 接口 ， 如 图 4-33 所 示 。 此 时 ， 整 个 接口 由 地 
址 信号 的 高 30 位 来 选 定 。 地 址 位 Al1 和 A0 用 于 选择 接口 中 三 个 可 编 址 单元 中 的 一 个 ， 即 两 个 数据 
寄存 器 和 一 个 状态 寄存 器 。 状 态 寄存 器 包括 标志 SIN 和 SOUT， 分 别 为 0 位 和 1 位 。 因 为 在 WO 接 
口中 ， 这 些 位 置 常常 为 寄存 器 ， 所 以 我 们 用 符号 RS1 和 RS0 来 标志 两 个 输入 ， 它 们 决定 寄存 器 的 
选取 。 

图 4-33 中 的 电路 使 用 独立 的 输入 和 输出 数据 线 来 连接 IO 设备 。 如 果 连 接 IHO 设 备 的 数据 线 是 
双向 的 ， 那 么 得 到 的 并 行 端口 将 会 更 加 复杂 。 图 4-34 是 一 个 通用 并 行 接口 电路 ， 它 可 以 按 多 种 方 
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法 进行 配置 。 数 据 线 P7 到 P0 既 可 以 用 作 输入 也 可 以 用 作 输 出 。 为 了 增加 灵活 性 ， 电 路 允许 在 程序 
控制 下 将 一 些 线路 用 于 输出 ， 一 些 线路 用 于 输入 。DATAOUT 寄 存 器 通过 数据 方向 寄存 器 DDR 控 
制 的 三 态 驱动 器 连接 到 数据 线 上 。 处 理 器 可 以 将 任意 的 8 位 序列 写 信 DDR。 对 某 一 特定 的 位 ， 如 
果 DDR 中 的 值 为 1， 相 应 的 数据 线路 就 作为 输出 线 ， 否 则 就 作为 输入 线 。 


PA7 





图 4-33 将 输入 输出 结合 在 一 起 的 接口 电路 


CS1 和 C2 用 来 控制 接口 电路 和 它 服务 的 MO 设备 之 闻 的 相互 作用 。 这 两 根 线 也 是 可 编程 的 。C2 
是 双向 的 ， 可 以 提供 几 种 不 同 的 发 信号 模式 ， 包 括 担 手 。 图 中 并 没有 显示 所 有 的 内 部 细节 ， 但 可 
以 看 出 这 些 部 分 是 如 何 与 图 4-33 对 应 的 .“ 就 绪 ” 和 “接受 ” 线 是 处 理 器 总 线 端 的 担 手 控制 线 ， 
因此 它们 和 主 控 就 绪 和 从 动 就 绪 信号 相连 。 输 入 信号 My-address 应 该 连接 到 地 址 译 码 器 的 输出 上 ， 
地 址 译 码 器 将 识别 出 分 配给 接口 的 地 址 。 共有 3 条 寄存 器 选择 线 , 可 以 允许 接口 中 最 多 8 个 寄存 器 ， 
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如 输入 输出 数据 ， 数 据 传输 方向 和 各 种 操作 模式 下 的 控制 和 状态 寄存 器 。 还 提供 有 中 斯 请 求 和 输出 
线 INTR ， 它 连接 到 计算 机 总 线 的 中 断 请 求 线 上 。 

实际 中 我 们 常常 用 到 具有 图 4-34 所 显示 特性 的 并 行 接口 电路 。 第 9 章 中 将 讲述 一 个 在 能 人 式 
系统 中 使 用 这 种 接口 电路 的 例子 。 在 该 系统 中 连接 IO 设备 的 端口 不 止 一 个 ， 可 以 有 2 到 更 多 个 。 
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图 4-34 通用 8 位 并 行 接口 


现在 来 分 析 一 下 图 4-28 到 图 4-34 中 的 接口 电路 是 如 何 被 修改 来 符合 图 4-25 中 的 总 线 协 议 的 。 
图 4-35 是 图 4-32 中 接口 的 一 种 修改 电路 。 前 面 我 们 已 经 介绍 了 产生 装 和 人 数据 和 读 取 状态 信号 的 时 
序 逻 辑 模块 。 在 图 的 底部 给 出 了 这 个 模块 的 状态 图 。 起 初 ， 搂 口 处 于 闲置 状态 。 当 地 址 译 码 器 的 
输出 My-address 显 示 该 接口 被 寻 址 后 ， 接 口 改变 状态 进行 响应 。 于 是 ， 接 口 启动 Go 信号 ， 并 根据 
地 址 位 A0 和 R/ 丈 线 的 状态 ， 启 动 装 和 人 数据 或 读 取 状 态 信号 。 

图 4-36 显 示 了 一 个 输出 操作 的 时 序 图 。 处 理 器 在 时 钟 周期 1 同时 发 送 数据 和 地 址 。 时 序 逻 辑 
在 时 钟 周期 2 开始 时 将 信号 Go 置 1， 该 信号 的 上 升 沿 将 输出 数据 装 入 到 寄存 器 DATAOUT。 读 取 状 
态 寄存 器 的 输入 操作 也 遵照 相似 的 时 序 。 因 为 请 求 的 数据 在 寄存 器 中 已 经 可 用 ， 并 能 立即 进行 传 
送 操作 ， 所 以 时 序 逻辑 模块 直接 从 闲置 状态 转换 到 响应 状态 。 结 果 ，、 这 个 传输 操作 要 比 图 4-25 中 
的 短 一 个 时 钟 周期 。 在 有 些 情 况 下 ， 在 数据 可 用 前 可 能 需要 一 些 时 间 ， 此 时 接口 应 该 首先 进入 等 
待 状态 ， 等 到 数据 准备 就 绪 后 才能 转换 到 响应 状态 。 
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图 4-35 对 应 图 4-25， 总 线 移 并 行 端口 接口 ， 带 有 时序 逻辑 的 状态 图 
[256] 总 结 一 下 对 这 些 接 口 电 路 例子 的 讨论 ， 为 了 使 概念 易于 阅 — 时 间 
读 和 理解 ， 我 们 简化 了 一 些 信号 的 表示 。 实 际 上 ， 从 动 就 绪 | 1 | 2 | 3] 


信号 很 可 能 是 一 个 漏 极 开路 信号 , Ky Slave ready, 时 名- A L TL LSF 
二 入 信号 也 是 如 此 。 这 条 线 必须 连接 一 个 上 拉 电 阻 来 


保证 它 总 是 处 于 无 效 (高 电 平 ) 状态 ， 除 非 它 被 某 个 设备 
启动 。 R/ W 
46.2 RITAN 数据 

品行 端口 用 于 连接 处 理 器 与 那些 要 求 每 次 只 传输 一 Go 


位 数据 的 MO 设备 。 串 行 端口 接口 电路 的 主要 特性 是 可 以 。 从 动 就 结 
在 设备 端 以 串 行 位 的 形式 通信 ， 而 在 总 线 端 以 并 行 位 的 形 图 4-36 图 4-35 中 输出 接口 的 时 序 
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式 通信 。 并 行 与 串 行 之 间 的 转换 由 移 位 寄存 器 完成 ， 移 位 寄存 器 有 并 行 存 取 的 能 力 。 图 4-37 是 一 
个 典型 的 串 行 接口 模块 图 。 它 包括 常见 的 DATAIN 和 DATAOUT 寄 存 器 。 输 入 移 位 寄存 器 接收 来 
自 MO 设 备 的 串 行 位 输入 。 当 8 位 数据 都 接收 完 后 ， 移 位 寄存 器 的 内 容 并 行 装 入 到 DATAIN 寄 存 器 
中 。 相 似 地 ，DAIAOUT 寄 存 器 中 的 输出 数据 也 被 装 人 输出 移 位 寄存 器 ， 在 输出 移 位 寄存 器 中 数 
据 被 逐 位 移出 并 发 送 到 MO 设备 上 。 






输出 移 位 寄存 器 


控制 和 状态 


图 4-37 串 行 接口 


这 种 接口 中 涉及 的 总 线 部 分 与 前 面 讲述 的 并 行 接 口 相 同 。 状 态 标 志 SIN 和 SOUT 的 功能 也 与 
并 行 接口 中 的 相似 。 当 新 数据 被 装 入 到 DATAIN 后 SIN 标 志 置 1， 处 理 器 读 取 了 DATAIN 中 的 内 容 
后 清 0。 一 旦 数据 从 输入 移 位 寄存 器 传送 到 了 DATAIN 寄 存 器 ， 移 位 寄存 器 就 可 以 开始 接收 来 自 
IO 设备 的 下 一 个 8 位 字符 。SOUT 标 志 指出 输出 缓冲 区 是 否 可 用 ， 处 理 器 将 新 数据 写 和 到 
DATAOUT 寄 存 器 后 被 置 0， 数 据 从 DATAOUT 寄 存 器 传送 到 输出 移 位 寄存 器 后 被 置 1。 

输入 输出 通路 上 使 用 的 两 个 缓冲 区 非常 重要 。 在 一 些 简单 的 接口 中 可 能 将 DATAIN 和 
DATAOUT 移 到 了 移 位 寄存 器 的 单元 中 ， 而 删除 了 图 4-37 中 的 移 位 寄存 器 。 但 是 ， 这 将 会 给 YO 设 
备 的 操作 带 来 不 便 ， 在 接收 完 来 自 串 行 线 上 的 一 个 字符 后 ， 设 备 只 有 等 到 处 理 器 读 取 了 DATAIN 
的 内 容 后 才能 开始 接收 下 一 个 字符 。 因 此 ， 两 个 字符 之 间 就 需要 一 个 间隔 让 处 理 器 来 读 取 输 入 数 
据 。 如 果 有 两 个 缓冲 区 的 话 ， 第 二 个 字符 的 传送 在 第 一 个 字符 从 移 位 寄存 器 装 入 到 DATAIN 寄 存 
器 后 就 可 以 开始 。 因此， 如果 假设 处 理 器 在 第 二 个 字符 的 串 行 传输 完成 前 读 取 了 DATAIN 寄 存 器 
的 内 容 ， 接 口 就 可 以 接收 连续 的 串 行 数据 流 。 在 接口 的 输出 通路 中 也 存在 类 似 的 情况 。 

因为 串 行 传输 只 需要 很 少 的 电路 ， 所 以 在 连接 物理 上 与 计算 机 相距 非常 远 的 设备 时 很 方便 。 


串 行 输 出 





接收 时 钟 





传送 时 钟 
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传输 的 速度 ， 通 常用 位 速率 来 表示 ， 它 取决 于 连接 设备 本 身 的 特性 。 为 了 适应 各 种 各 样 的 设备 ， 
串 行 接口 必须 能 够 使 用 各 种 不 同 的 时 钟 速度 。 图 4-37 中 的 电路 允许 对 输入 和 输出 操作 分 别 使 用 独 
立 的 时 钟 以 提高 灵活 性 。 

因为 串 行 接口 在 连接 MO 设备 中 起 着 至 关 重 要 的 作用 ， 所 以 已 经 定义 了 多 种 广泛 使 用 的 标准 。 
具有 图 4-37 特 性 的 标准 接口 电路 称 为 通用 异步 收发 器 (UART)， 它 主要 用 于 低速 串 行 设备 。 数 据 
传送 采用 的 是 异步 起 止 方式 ， 起 止 方式 将 在 第 10 章 讲述 。 为 了 便于 连接 到 通信 链 路 上 ， 开 发 出 了 
流行 的 RS-232-C 标 准 接口 ， 这 些 也 将 在 第 10 章 详细 描述 。 


4.7 标准 MO 接口 


前 面 几 节 中 我 们 曾 指出 计算 机 总 线 有 多 种 可 供 选 择 的 设计 。 这 种 多 样 性 意味 着 配备 有 这 种 接 
口 电路 的 IO 设备 适用 于 一 台 计 算 机 不 一 定 就 适用 于 另 一 台 计 算 机 。 因 此 ， 每 一 种 IO 设备 与 计算 
机 的 连接 可 能 都 需要 设计 一 种 不 同 的 接口 ， 这 样 就 会 产生 很 多 不 同 的 接口 。 最 符合 实际 的 解决 办 
法 就 是 开发 出 标准 的 接口 信号 和 协议 。 

这 里 首先 来 了 解 一 下 计算 机 系统 是 如 何 被 组 装 起 来 的 。 通 常 个 人 计算 机 都 包括 有 一 个 称 为 主 
板 的 印刷 电路 板 。 在 这 块 板 上 安装 有 CPU 芯片 、 主 存 以 及 一 些 MO 接 口 。 它 还 包含 一 些 连接 器 ， 
可 以 插入 额外 的 接口 。 

处 理 器 总 线 是 由 处 理 器 芯片 自己 定义 的 信号 。 那 些 需 要 连接 到 处 理 器 的 高 速 设备 ， 如 主 存 ， 
可 以 直接 连接 到 这 些 总 线 上 。 由 于 电气 方面 的 原因 ， 只 有 很 少 的 设备 可 以 用 这 种 方式 连接 。 主 板 
中 通常 提供 另外 的 总 线 来 支持 更 多 的 设备 。 这 两 种 总 线 通过 一 个 电路 相互 连接 起 来 ， 这 个 电路 我 
们 称 作为 桥 ， 它 将 一 种 总 线 的 信号 和 协议 转换 成 另 一 种 总 线 的 信号 和 协议 。 连 接 到 扩展 总 线 上 的 
设备 ， 在 处 理 器 看 来 就 好 像 是 连接 到 它 自己 的 总 线 上 一 样 。 惟 一 的 不 同 之 处 是 ， 在 处 理 器 与 那些 
设备 之 间 的 数据 传送 中 ， 桥 电路 会 产生 一 个 小 小 的 延迟 。 

总 线 结构 与 处 理 器 的 体系 结构 密切 相关 , 而 且 还 依赖 于 处 理 器 芯片 的 电气 特性 ,如 时 钟 速度 ， 
所 以 不 可 能 为 处 理 器 总 线 定义 一 个 统一 标准 。 但 扩展 总 线 就 没有 这 些 限制 了 ， 因 此 可 以 使 用 标准 
的 信号 方式 。 已 经 有 许多 标准 被 开发 出 来 了 。 其 中 有 些 标准 是 默认 的 ， 当 特定 的 设计 在 商业 上 取 
得 成 功 时 ， 这 些 设计 就 成 为 了 事实 上 的 标准 。 例 如 ，IBM 为 它 的 个 人 计算 机 PC AT 开 发 的 总 线 ISA 
(工业 标准 体系 结构 )， 由 于 这 种 计算 机 的 流行 导致 其 他 制造 商 为 他 们 的 1/O 设 备 生产 出 与 1SA 兼 容 
的 接口 ， 这 样 ISA 就 成 为 了 事实 上 的 标准 。 

还 有 一 些 标准 是 行业 共同 协作 开发 的 ， 由 于 在 兼容 产品 上 的 共同 切身 利益 ， 即 使 那些 互相 况 
争 的 公司 也 参与 了 标准 的 开发 。IEEE (电气 和 电子 工程 师 协会 )、ANSI (美国 国家 标准 学 会 ) 等 
组 织 及 一 些 国际 组 织 如 ISO (国际 标准 化 组 织 ) 已 经 承认 了 这 些 标准 ， 并 给 它们 授予 官方 的 地 位 。 

在 这 一 节 中 ， 我 们 讲述 三 种 广泛 使 用 的 标准 : PCI (外 围 部 件 互 连 )、SCSI (小 型 计算 机 系统 
接口 ) 和 USB (通用 趾 行 总 线 )。 图 4-38 显 示 了 这 些 标准 在 一 般 计算 机 系统 中 的 使 用 方法 。PCI 标 
准 定义 了 主板 上 的 一 种 扩展 总 线 。SCSI 和 USB 标 准 用 来 连接 机 箱 内 外 的 附加 设备 。SCSI 总 线 是 高 
速 并 行 总 线 ， 用 于 像 硬盘 和 视频 显示 器 之 类 的 设备 。USB 总 线 使 用 品行 传输 ， 适 合 键盘 、 游 戏 控 
制 器 和 Intemet 韦 接 等 设备 的 需求 。 图 中 显示 了 一 个 可 以 与 早期 的 ISA 标 准 连接 相 兼 容 的 设备 接口 
电路 ， 比 如 流行 的 IDE (集成 设备 电子 电路 ) 磁盘 。 还 显示 了 一 个 与 Ethemet 的 连接 。Ethemet 是 
一 种 广泛 使 用 的 局 域 网 ， 为 建筑 物 或 大 学 校园 里 的 计算 机 之 间 提 供 高 速 互 连 。 

一 台 特 定 的 计算 机 使 用 的 标准 可 能 不 止 一 个 。 典 型 的 Pentium 计 算 机 有 PCI 和 ISA 两 种 总 线 ， 
以 提供 大 范围 的 设备 给 用 户 选 择 。 
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图 4-38 一 个 使 用 不 同 接 口 标准 的 计算 机 系统 的 例子 


4.7.1 外 围 部 件 互 连 (PCI) 总 线 


PCI 总 线 员 是 那些 由 于 标准 化 的 要 求 而 产生 的 系统 总 线 中 的 一 个 很 好 的 例子 。 它 支持 处 理 器 
总 线 的 切 能 ， 但 又 以 一 种 标准 的 形式 独立 于 任何 特定 的 处 理 器 。 连 接 到 PCI 总 线 的 设备 在 处 理 
器 看 来 就 好 像 它们 是 直接 连接 到 处 理 器 总 线 上 的 一 样 。 它 们 在 处 理 器 的 存储 器 地 址 空间 内 分 配 
地 址 。 

在 PCI 标 准 之 前 还 有 一 系列 主要 用 于 IBM PC 上 的 总 线 标准 。 早 期 的 PC 使 用 8 位 XT 总 线 ， 它 的 

冒号 和 Intel 80x86 处 理 器 的 信号 十 分 相似 。 此 后 ，16 位 的 总 线 开始 用 于 PC AT 计算 机 ， 即 ISA 总 线 ， 
它 的 32 位 扩展 版 本 称 为 BISA 总 线 。 其 他 在 20 世 纪 80 年 代 开 发 的 具有 相似 功能 的 总 线 还 有 在 IBM 
PC 中 使 用 的 Microchannel 和 在 Macintosh 计 算 机 上 使 用 的 NuBus，。 

PCI 是 一 种 廉价 且 真 正 独 立 于 处 理 器 的 总 线 。 它 的 设计 预见 了 为 支持 高 速 磁盘 、 图 形 和 视频 
设备 而 引起 的 对 总 线 带 宽 需求 的 快速 增长 ， 也 预见 了 对 多 处 理 器 系统 专业 化 需求 的 快速 增长 。 
PCI 总 线 自 从 1992 首 次 被 推出 ， 近 十 年 来 作为 一 个 工业 标准 一 直 非 常 流行 。 

PCI 总 线 首创 的 一 个 重要 特性 是 WO 设备 的 即 插 即 用 。 要 连接 一 台新 的 设备 ， 用 户 只 需 将 设备 接 
口 板 连接 到 总 线 即 可 ， 其 余 的 操作 由 软件 来 完成 。 在 讲述 PC[ 总 线 如 何 工作 时 我 们 将 讨论 该 特性 。 

数据 传送 

在 当代 计算 机 中 ， 大 部 分 的 存储 器 传输 中 都 包含 一 组 数据 而 不 只 是 一 个 字 。 原 因 是 现代 计算 
机 都 有 缓冲 存储 器 〈 见 图 1-6)。 数 据 在 缓冲 存储 器 和 主 存 之 间 以 几 个 字 的 块 形式 进行 传输 ， 这 在 
第 5 章 我 们 将 进行 解释 。 传 输 的 字 存 储 在 连续 的 存储 器 单元 中 。 当 处 理 器 (实际 上 是 缓存 控制 器 ) 
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指定 一 个 地 址 请 求 一 次 对 主 存 的 读 操作 时 , 存储 器 就 从 该 地 址 开始 发 送 一 个 数据 字 序列 进行 响应 。 
类 似 地 ， 在 写 操作 中 ， 处 理 器 首先 发 送 一 个 存储 器 地 址 ， 然 后 将 其 后 面 一 个 数据 字 序 列 写 人 到 从 
该 地 址 开始 的 连续 存储 器 区 域 中 。PCI 主 要 是 为 了 支持 这 种 操作 模式 而 设计 的 。 只 包括 单个 字 的 
读 写 操作 可 简单 地 认为 是 长 度 为 1 的 块 。 

PCI 总 线 支 持 三 个 独立 的 地 址 空间 : 存储 器 、WO 和 配置 。 前 两 个 从 名 称 上 我 们 就 可 以 知道 它 
们 的 意思 。1O 地 址 空间 主要 用 于 那些 有 独立 的 /0 地 址 空间 的 处 理 器 ， 如 Pentium。 然 而 ， 就 如 
第 3 章 提 到 的 ， 即 使 有 独立 的 WO 地 址 空间 可 用 ， 系 统 设 计 者 也 可 以 选用 存储 器 上 映射 /JO 寻 址 。 实 
际 上 ，PCI 总 线 就 是 建议 使 用 这 种 方法 以 获得 更 广泛 的 兼容 性 。 配 置 空间 是 用 来 支持 PCI 即 插 即 
用 功能 的 ， 后 面 将 简要 说 明 。 伴 随地 址 的 一 个 4 位 指令 将 指明 在 特定 数据 传输 操作 中 使 用 的 是 哪 
一 个 地 址 空间 。 

在 图 4-38 中 计算 机 主 存 直接 连接 到 处 理 器 总 线 上 。 图 4-39 中 显示 了 另 一 种 常 与 PCI 总 线 一 起 使 
用 的 结构 。PCI 桥 为 主 存 提供 了 一 个 独立 的 物 
理 连 接 。 由 于 电气 原因 ， 总 线 可 能 被 进一步 分 
成 几 个 部 分 并 通过 桥 连 接 起 来 。 但 是 ， 不 管 设 
备 连接 到 总 线 上 的 哪 一 部 分 ， 它 都 可 能 被 映射 
到 处 理 器 的 存储 器 地 址 空间 中 。 

PCI 总 线 上 的 信号 约定 类 似 于 图 4-25 中 使 
用 的 方式 。 在 图 4-25 中 ， 我 们 假设 主 控 设备 将 
在 总 线 上 保持 地 址 信息 直到 数据 传输 结束 。 
但 这 并 不 是 必须 的 ， 地 址 信息 只 需 保持 到 从 
动 设备 被 选 定 就 足够 了 。 从 动 设备 可 以 将 地 
址 存储 在 它 的 内 部 缓冲 区 中 。 因 此 ， 地 址 在 总 
线 上 只 需 保持 一 个 周期 即 可 ， 这 样 就 可 以 释放 
地 址 线 , 使 它 在 后 续 时 钟 周期 中 用 于 发 送 数 据 。 
这 样 可 以 节约 大 量 成 本 ， 因 为 总 线 的 线路 数量 是 一 个 重要 的 成 本 因素 。PCI 总 线 使 用 的 就 是 这 种 
方法 。 . 

在 任何 时 候 都 有 一 台 设备 是 总 线 主 控 器 。 它 可 以 通过 发 布 读 写 命令 启动 数据 传送 。 主 控 设备 
在 PCI 术 语 中 称 为 启动 设备 ， 它 可 以 是 处 理 器 或 DMA 控 制 器 。 响 应 读 写 命令 的 被 寻 址 设备 称 为 目 
标 设备 。 

为 理解 PCI 总 线 的 操作 和 它 的 各 种 特性 ， 下 面 我 们 将 分 析 一 个 典型 的 总 线 事务 。 表 4-3 中 列 
出 了 用 于 传输 数据 的 主要 信号 。 以 # 千 尾 命名 的 信号 说 明 低 电 平 有 效 。PCI 协 议 与 图 4-25 的 主要 
区 别 是 除了 目标 就 绪 信号 外 ，PCI 还 使 用 了 起 始 就 绪 信号 IRDY#。IRDY# 信 号 主要 用 于 支持 块 
传送 。 

让 我 们 来 看 一 个 处 理 器 从 存储 器 中 读 取 4 个 32 位 字 的 总 线 事务 。 在 这 个 事务 中 ， 启 动 设备 是 
处 理 器 ， 目 标 设备 是 存储 器 。 总 线 上 一 次 完整 的 传送 操作 ,包括 一 个 地 址 和 一块 数 据 ， 称 为 事务 。 
事务 内 单个 字 的 传送 称 为 相位 。 图 4-40 显 示 了 总 线 上 的 事件 顺序 。 时 钟 信 号 提供 时 序 参考 来 协调 
事务 中 的 不 同 相位 。 所 有 信号 的 跳 变 由 时 钟 的 上 升 沿 触发 。 与 图 4.25 一 样 ， 通 过 显示 信号 在 这 个 
时 钟 周期 中 稍 后 才 发 生变 化 来 表示 它们 遇 到 的 延迟 。 
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图 4-39 PCI 总 线 在 计算 机 系统 中 的 使 用 





34-3 PC| 总 线 上 的 数据 传送 信和 号 


名 R J 能 
CLK 33MHz 或 66MHz 的 时 钟 
FRAME# 由 启动 设备 发 送 ， 表 示 事 务 的 持续 时 间 
AD 32 位 地 址 /数据 线 ， 可 以 增加 到 64 位 
C/BE# 4 位 指令 / 字 节 人 允许 线 〈64 位 总 线 时 为 8 位 ) 
IRDY#,TRDY# 起 始 就 绪 信 号 和 目标 就 绪 信 号 
DEVSEL# 来 自 设 备 的 啊 应 ， 表 示 它 已 经 识别 了 地 址 并 准备 好 了 数据 传送 事务 
IDSEL# 初始 化 设备 选择 


CLK 


Frame# 


AD 


C/BE# 


IRDY# 


TRDY# 


DEVSEL# 





在 时 钟 周期 1， 处 理 器 启动 信号 FRAME# 和 表示 事务 开始 。 同 时 ， 它 将 地 址 发 送 到 AD 线 上 ， 将 
指令 发 送 到 C/BE# 线 。 在 本 例 中 ， 指 令 指 明了 这 是 一 次 读 操作 请 求 和 使 用 的 存储 器 地 址 空间 。 

时 钟 周期 2 用 来 转换 AD 线 。 处 理 器 撤销 地 址 信号 并 将 它 的 驱动 器 从 AD 线 上 断 开 。 被 选 定 的 
目标 设备 将 它 的 驱动 器 连接 到 AD 线 上 ， 并 在 时 钟 周 期 3 将 被 请 求 的 数据 取出 来 放 到 总 线 上 。 它 还 
启动 DEVSEL# 信 号 并 保持 到 事务 结束 。 

C/BHE# 线 在 时 钟 周期 1 用 来 发 送 总 线 指令 ， 在 其 余 周 期 中 用 作 其 他 目的 。 四 根 线 中 的 每 一 根 
都 与 AD 线 上 的 一 个 字 节 相关 联 。 启 动 设 备 设置 CUBE# 村 中 的 一 根 或 儿 根 来 表示 哪儿 根 字 节 线 被 用 
来 传送 数据 。 假 设 目标 设备 每 次 可 以 传送 32 位 ， 那 么 四 根 C/BE# 线 都 有 效 。 

在 时 钟 周期 3， 启 动 设备 发 送 起 始 就 绪 信 号 IRDY#， 表 示 它 已 经 准备 好 接收 数据 了 。 如 果 目 
标 设备 此 时 也 已 经 准备 好 发 送 数据 ， 它 就 启动 目标 就 绪 信 号 TRDY#， 并 发 送 1 个 字 的 数据 。 启 动 
设备 在 这 个 时 钟 周 期 结束 时 将 数据 装 入 到 输入 缓冲 区 。 目 标 设备 在 时 钟 周期 4 到 6 发 送 其 余 3 个 字 
的 数据 。 

启动 设备 使 用 FRAME# 信 号 表示 脉冲 的 持续 时 间 。 它 在 传送 倒数 第 二 个 字 时 取消 这 个 信号 。 
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因为 本 事务 要 求 读 取 4 个 字 的 数据 ， 所 以 启动 设备 在 时 钟 周期 5， 也 就 是 在 它 接收 第 3 个 字 的 周期 
取消 FRAME# 信 号 。 在 时 钟 周期 6 发 送 完 第 4 个 字 后 ， 目 标 设备 断 开 它 的 驱动 器 并 在 时 钟 周期 7 开 
始 时 取消 DEVSEL# 信 号 

图 4-41 给 出 了 一 个 更 一 般 的 输入 事务 的 例子 。 它 显示 了 启动 设备 和 目标 设备 是 怎样 分 别 使 用 
IRDY# 和 TRDY# 信 号 来 表示 事务 中 间 的 停顿 的 。 这 个 读 操 作 的 开始 与 图 4-40 一 样 ， 前 两 个 字 被 传 
送 。 目 标 设备 在 周期 5 发 送 第 3 个 字 。 然 而 ， 我 们 假设 此 时 启动 设备 不 能 接收 第 3 个 字 、 所 以 它 就 
取消 了 IRDY# 信 号 。 相 应 地 ， 目 标 设备 就 在 AD 线 上 保持 第 3 个 字 直 到 IRDY# 再 次 有 效 。 在 周期 6， 
启动 设备 启动 RDY# 信 号 并 在 这 个 周期 末 将 数据 装 入 到 它 的 输入 缓冲 区 中 。 在 这 里 ， 我 们 假设 目 
标 设备 没有 立即 准备 好 传送 第 4 个 字 ， 因 此 它 在 第 ?7 个 周期 开始 时 取消 TRDY# 信 号。 在 周期 8， 它 
发 送 第 4 个 字 并 启动 TRDY#。 因为 FRAME# 在 传输 第 3 个 字 时 就 已 经 取消 了 ， 所 以 在 传输 完 第 4 个 
字符 后 事务 就 结束 了 。 
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图 4-41 显示 下 DYHWTRDY# 信 号 作用 的 读 操作 

设备 配置 

将 一 台 WO 设 备 连 接 到 计算 机 上 时 ， 需 要 对 与 它 进行 通信 的 设备 和 软件 进行 配置 操作 。 例 如 ，、 
典型 的 ISA 总 线 的 设备 接口 卡 ， 就 有 大 量 的 跳 线 或 开关 需要 用 户 来 配置 。 一 旦 设备 连接 到 了 计算 
机 上 ， 软 件 就 需要 知道 设备 的 地 址 ， 可 能 还 需要 知道 一 些 相 关 的 设备 特性 ， 如 传输 连接 的 速度 、 
是 否 使 用 了 奇偶 校 验 位 等 。 

PCI 为 每 一 个 WO 设备 接口 分 配 一 个 较 小 的 配置 ROM 存 储 器 来 保存 有 关 设 备 的 信息 ， 这 样 简化 
了 配置 过 程 。 所 有 设备 的 配置 ROM 在 配置 地 址 空间 内 都 可 以 被 访问 。PCI 的 初始 化 软件 在 系统 启 
动 或 复位 时 读 取 这 些 ROM 的 内 容 ， 根 据 这 些 内 容 确 定 该 设备 是 打印 机 、 键 盘 、Ethemet 接 口 或 磁 
盘 控 制 器 ， 还 可 以 得 知 各 种 设备 选项 和 特性 。 

设备 的 地 址 是 在 初始 化 过 程 中 分 配 的。 也 就 是 说 在 总 线 配置 操作 期 间 ， 不 能 根据 它们 的 地 址 
访问 设备 ， 因 为 还 设 有 给 它们 分 配 地 址 。 因 此 ， 配 置地 址 空间 使 用 了 另 一 种 不 同 的 机 制 。 每 台 设 





备 都 有 一 个 输入 信号 称 为 初始 化 设备 选择 IDSEL#。 在 配置 操作 期 间 、 正 是 这 个 信号 ， 而 不 是 施 
加 在 设备 AD 输入 上 的 地 址 信号 ， 使 得 这 个 设备 被 选 定 。 设 备 的 连接 器 播 在 主板 的 上 面 ， 一 般 都 
将 每 台 设 备 的 IDSEL#31 脚 连接 到 高 位 的 21 根 地 址 线 上 ，AD11 到 AD31 上。 因此 ，、 我 们 可 以 通过 发 
布 一 个 配置 命令 和 一 个 地 址 来 选 定 一 台 设 备 进行 配置 操作 ， 在 发 布 的 地 址 中 相应 的 AD 线 被 置 1， 
其 余 的 20 根 线 被 置 0。 低 位 地 址 线 AD10 到 AD00 用 来 说 明 操作 的 类 型 和 访问 设备 配置 ROM 的 内 容 。 
这 种 结构 将 设备 数量 限制 在 21 台 以 内 。 

配置 软件 扫 找 配置 地 址 空间 内 的 所 有 21 个 位 置 确定 安装 了 哪些 设备 。 每 台 设备 可 以 在 IO 或 
存储 器 空间 申请 一 个 地 址 。 将 这 个 地 址 写 人 到 适当 的 设备 寄存 器 后 ， 设 备 就 和 相应 的 地 址 相关 联 
了 。 配 置 软件 也 设置 一 些 参 数 如 设备 中 断 优先 级 等 。PCI 总 线 有 四 根 中 断 请 求 线 。 通 过 写 人 设备 
配置 寄存 器 ， 配 置 软件 指示 设备 使 用 哪 一 根 线 请 求 中 断 。 如 果 设 备 需 要 初始 化 ， 初 始 化 代码 就 存 
储 在 设备 接口 的 ROM 中 (这 个 ROM 与 配置 过 程 中 使 用 的 不 同 )。PCI 软 件 读 取 该 代码 并 执行 它 来 
完成 所 要 求 的 初始 化 操作 。 

这 个 过 程 将 用 户 从 必须 进行 相关 配置 的 操作 中 解放 出 来 。 使 用 者 只 需 插 上 接口 板 并 打开 电源 
即 可 ， 其 余 的 工作 全 部 由 软件 来 完成 。 

PCI 总 线 在 PC 领域 获得 了 极 大 的 流行 。 它 也 用 在 许多 其 他 的 计算 机 中 ， 比 如 SUN， 这 些 主 要 
得 益 于 它 可 以 为 大 范围 的 WO 设备 提供 PCI 接 口 。 在 一 些 处 理 器 中 ， 如 Compag Alpha，PCI 处 理 器 
桥 电 路 被 集成 在 处 理 器 芯片 中 ， 这 就 更 简化 了 系统 的 设计 和 封装 。 

电气 特性 

规定 PCI 总 线 在 5V 或 3.3V 电 源 下 工作 。 主 板 可 以 在 任何 信号 系统 下 工作 。 扩 展板 上 连接 器 的 
设计 可 以 确保 只 有 在 兼容 的 主板 上 才 可 以 将 它们 播 进 去 。 


4.7.2 SCSI 总 线 


缩写 SCSI 代 表 小 型 计算 机 系统 接口 。 它 是 由 美国 国家 标准 组 织 (ANSI) 根据 设计 X3.1312 定 
义 的 一 种 总 线 标 叭 。 在 最 初 规定 中 ， 磁 盘 等 设备 通过 50 根 线 的 电费 连接 到 计算 机 中 ， 电 费 最 长 可 
达 25 米 ， 数 据 传输 速率 最 高 可 达 SMBAs。 

SCSTI 总 线 标 准 经 历 了 多 次 修改 ， 它 的 数据 传输 能 力 增长 得 非常 快 ， 几 乎 每 两 年 就 翻 一 倍 。 
SCSI-2 和 SCSI-3 已 经 被 定义 ， 每 一 种 都 有 好 几 个 选项 。SCSI 可 能 只 有 8 根 数据 线 ， 称 为 窄 总线， 
每 次 只 能 传输 一 个 字 节 的 数据 。 此 外 ， 有 16 根 数据 线 的 宽 总 线 每 次 能 传输 16 位 。 使 用 的 电信 和 号 方 
式 也 有 好 几 种 选择 。SCSI 总 线 可 以 使 用 单 端 传输 (SE)， 此 时 每 一 个 信号 使 用 一 根 线 ， 对 于 所 有 
信号 使 用 一 个 共用 的 地 进行 返回 。 在 另 一 种 选择 中 ， 使 用 了 差分 信号 ， 对 每 一 个 信号 都 提供 有 单 
独 的 返回 线 。 这 种 方式 有 两 种 电 平 可 以 使 用 。 早 期 的 标准 使 用 5V (TTL 电 平 ) 称 为 高 电 平 差分 
(HVD)。 最近， 又 推出 了 3.3V 的 标准 称 为 低 电 平 差 分 (LVD). 

由 于 有 这 些 不 同 的 选项 ， 所 以 SCSI 连 接 器 可 能 有 50、68 和 80 个 引 脚 。 目 前 流行 的 商用 设备 的 
最 大 传输 速率 在 3MB/s 到 160MB/s 之 间 。SCSI 标 准 的 最 新 版 本 可 支持 高 达 320MB/s 的 传输 速率 ， 
640MB/As 的 版 本 不 久 也 有 望 出 现 。 具 体 总 线 上 的 最 大 传输 速率 通常 是 电缆 长 度 和 连接 设备 数量 的 
函数 ， 长 度 越 短 、 设 备 越 少 速率 就 越 高 。 为 了 获得 最 高 数据 传输 速率 ， 总 线 长 度 一 般 限 制 在 1.6m 
(SE 方式 ) 和 12m (LVD 方 式 ) 以 内 。 但是， 制造 商 常常 还 提供 专门 的 总 线 扩展 器 来 连接 远 距 高 
的 设备 。 这 种 总 线 可 容纳 的 最 大 设备 数量 ， 窗 总 线 为 8 台 ， 袖 总 线 为 16 台 。 

连接 到 SCSI 总 线 的 设备 不 属于 处 理 器 的 地 址 空间 ， 这 与 连接 到 处 理 器 总 线 的 设备 是 一 样 的 。 
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SCSI 总 线 通过 SCSI 控 制 器 连接 到 处 理 器 总 线 上 ， 如 图 4-38 所 示 。 这 个 控制 器 使 用 DMA 方 式 在 主 
存 和 设备 之 间 传 送 数据 包 。 数 据 包 可 能 是 一 个 数据 块 ， 也 可 能 是 处 理 器 发 送 给 设备 的 命令 或 设备 
的 状态 信息 。 

为 了 说 明 SCSI 总 线 的 操作 ， 让 我 们 来 看 一 下 它 是 如 何 与 磁盘 驱动 器 一 起 工作 的 。 与 磁盘 驱动 
器 通信 与 跟 主 存 通信 在 本 质 上 是 完全 不 同 的。 如 第 5 章 所 述 ， 数 据 是 存储 在 磁盘 的 扇 区 中 的 ， 每 
个 扇 区 包括 几 百 个 字 节 。 这 些 数据 没有 必要 存储 在 相 邻 的 遍 区 中 ， 因 为 磁盘 中 一 些 扇 区 可 能 已 经 
存储 了 数据 ， 还 有 一 些 可 能 有 缺陷 必须 忽略 。 所 以 ， 一 次 读 或 写 请 求 访问 的 可 能 是 几 个 不 相 邻 的 
磁盘 扇 区 。 由 于 磁盘 机 械 移动 的 限制 ， 在 到 达 第 一 个 需要 传送 数据 的 扁 区 前 可 能 会 有 几 毫 秒 的 较 
长 延迟 ， 然 后 一 段 数据 被 高 速 传送 。 接 着 又 会 发 生 另 一 个 延迟 ， 传 送 另 一 段 数据 。 一 次 读 或 写 请 
求 可 能 包括 好 几 段 这 样 的 数据 。SCSI 协 议 有 助 于 这 种 操作 模式 的 实现 。 

连接 到 SCSI 总 线 的 控制 器 是 如 下 两 种 类 型 之 一 一 一 启动 控制 器 或 目标 控制 器 。 启 动 控制 器 可 
以 选择 一 台 特 定 的 目标 控制 器 并 发 送 指令 指明 将 要 执行 的 操作 。 很 明显 ,处 理 器 这 一 侧 的 控制 器 ， 
如 图 4-38 中 的 SCSI 控 制 器 ， 必 须 可 以 作为 启动 控制 器 进行 工作 。 磁 盘 控 制 器 是 作为 目标 控制 器 进 
行 工 作 的 ， 它 执行 来 自 启 动 控 制 器 的 命令 。 局 动 控制 器 将 与 选 定 的 目标 控制 器 建立 一 个 远 辑 连接 。 
连接 建立 后 ， 可 以 根据 传送 命令 和 数据 块 的 需要 将 其 中 断 和 恢复 。 当 一 个 连接 被 中 断后 ， 其 他 设 
备 可 以 使 用 总 线 传送 数据 。 重 登 数据 传送 请 求 的 能 力 是 SCSI 总 线 的 主要 特性 之 一 ， 它 使 SCSI 总 
线 具 有 较 高 的 性 能 。 

SCSI 总 线 上 的 数据 传送 总 是 由 目标 控制 器 控制 的 。 为 了 发 送 一 个 命令 给 目标 设备 ， 启 动 控制 
器 请 求 总 线 控制 权 ， 仲 裁 获 胜 后 启动 控制 器 选择 要 进行 通信 的 控制 器 并 将 总 线 控制 权 转交 给 它 ， 
然后 控制 器 启动 一 次 数据 传送 操作 接收 来 自 启动 设备 的 命令 。 

下 面 分 析 一 个 完整 的 磁盘 读 操 作 例子 。 这 里 虽然 我 们 认为 启动 控制 器 是 操作 的 发 起 者 ， 但 应 
该 清楚 的 是 ， 只 有 接收 到 处 理 器 相应 的 命令 后 ， 启 动 控制 器 才 执 行 这 些 操作 。 假 设 处 理 器 要 从 磁 
盘 驱 动 器 读 取 一 块 数据 时 ， 这 些 数 据 存 储 在 两 个 不 相 邻 的 磁盘 扁 区 中 。 处 理 器 发 送 一 个 命令 给 
SCSI 控 制 器 ， 将 发 生 如 下 事件 序列 : 

1. SCSI 控 制 器 作为 启动 控制 器 竞争 总 线 控制 权 。 

2. 当 启 动 控制 器 在 仲裁 过 程 中 获胜 后 ， 它 选择 目标 控制 器 并 将 总 线 控制 权 转交 给 它 。 

3. 目标 设备 启动 一 次 输出 操作 (从 启动 设备 到 目标 设备 ) ; 启动 设备 响应 ， 发 送 一 个 命令 来 
说 明 要 求 的 读 操 作 。 

4. 目标 设备 认识 到 它 首 先 需 要 执行 磁盘 查找 操作 ， 于 是 就 发 送 一 条 消息 给 启动 设备 表明 它 要 
暂时 中 断 连 接 ， 然 后 释放 总 线 。 

5. 目标 控制 器 发 送 一 个 命令 给 磁盘 驱动 器 移动 磁头 到 读 操作 中 的 第 一 个 扇 区 。 然 后 ， 读 取 存 
储 在 扇 区 里 的 数据 并 保存 到 数据 缓冲 区 中 。 当 准备 好 开始 传送 数据 给 启动 设备 时 ， 目 标 设备 请 求 
总 线 控制 权 。 仲 裁 获 胜 后 ， 它 重新 选 启动 控制 器 ， 从 而 恢复 被 中 斯 的 连接 。 

6. 目标 设备 传送 数据 缓冲 区 的 内 容 给 启动 设备 ， 然 后 再 次 中 断 连 接 。 数 据 可 以 8 位 或 16 位 的 
并 行 传送 ， 这 取决 于 总 线 宽度 。 

7. 目标 控制 器 发 送 一 个 命令 给 磁盘 驱动 器 执行 另 一 次 查找 操作 。 然 后 ， 和 上 次 一 样 将 第 二 个 
磁盘 扇 区 的 内 容 传送 给 启动 设备 。 这 次 传送 结束 后 ， 两 个 控制 器 之 间 的 逻辑 连接 终止。 

8. 当 启 动 设备 控制 器 接收 到 数据 时 ， 它 使 用 DMA 方 式 将 数据 存储 到 主 存 中 。 

9. SCSI 控 制 器 发 送 一 个 中 断 给 处 理 器 通知 它 请 求 的 操作 已 经 完成 。 








这 一 过 程 表明 SCSI 总 线 上 交换 的 消息 要 比 处 理 器 总 线 上 交换 的 消息 更 高 级 一 些 。 这 里 的 “更 
高 级 ”是 指 这 些 消 息 涉及 的 操作 和希 要 好 儿 步 才能 完成 ， 这 取决 于 有 具体 的 设备 。 处 理 器 和 SCSI 控 制 
器 都 不 需要 了 解数 据 传送 过 程 中 特定 设备 的 具体 操作 。 在 上 面 的 例子 中 处 理 器 不 需要 参与 磁盘 查 
找 操作 。 

SCSI 总 线 标准 定义 了 大 量 的 控制 消息 ， 这 些 消 息 可 以 在 控制 器 之 间 交 换 来 操作 不 同类 型 的 
IO 设备 。 还 定义 了 用 来 处 理 在 设备 操作 和 数据 传送 期 间 发 生 各 种 错误 和 失败 情况 的 消息 。 

总 线 信号 

现在 我 们 从 硬件 方面 来 描述 一 下 SCSI 总 线 的 操作 。 表 4-4 总 结 了 总 线 信号 。 为 简单 起 见 ， 只 
显示 了 牵 总 线 (8 根 数据 线 ) 的 信号 。 这 里 所 有 信号 名 称 前 都 有 一 个 减 号 ， 这 表示 在 低 电 平 状态 
时 信号 有 效 或 数据 线 等 于 1。SCSI 总 线 没 有 地 址 线 。 在 选择 、 重 选 及 总 线 仲裁 期 间 ，SCSI 使 用 数 
据 线 来 识别 总 线 控制 器 。 对 于 罕 总 线 ， 最 多 可 以 有 8 个 控制 器 ， 编 号 0 到 7， 每 一 个 控制 器 与 同 号 
的 数据 线 相 联系 。 宽 总 线 最 多 可 容纳 16 个 控制 器 。 控 制 器 通过 激活 相应 的 数据 线 将 它 自己 的 或 其 
他 控制 器 的 地 址 放 到 总 线 上 。 因 此 ， 在 总 线 上 可 能 同时 有 多 于 一 个 的 地 址 ， 就 像 下 面 我 们 将 要 讲 
述 的 仲裁 过 程 那样 。 一 旦 在 两 个 控制 器 之 间 建 立 了 连接 ， 就 不 需要 进一步 录 址 了 ， 数 据 线 就 可 以 
用 来 传输 数据 了 。- 


表 4-4 SCSI 总 线 的 信号 








类 J 名 w 功 能 

数据 -DB(0) 到 DBO) 数据 线 : 在 信息 传送 阶段 携带 一 个 字 节 的 信息 ， 在 仲裁 、 选 择 和 重 选 阶 段 
-DB(P) 识别 设备 数据 线 的 奇偶 校 验 位 

状态 -BSY BR: ARAA 
-SEL 选择 : 在 选择 和 重 选 期 间 有 效 

ABRE -C/D 控制 /数据 : 传送 控制 信息 时 有 效 (命令 、 状 态 或 消息 ) 
-MSG 消息 : 指示 传送 的 信息 是 消息 

握手 ~ REQ 请 求 : 目标 设备 在 请 求 一 个 数据 传送 周期 时 有 效 
一 ACK 应 答 : 启动 设备 完成 一 次 数据 传送 操作 后 有 效 

传输 方向 -10 输入 /输出 : 有 效 时 表示 输入 操作 (相对 于 启动 设备 ) 

其 他 -ATN 注意 : 当 启 动 设备 想 杰 发 送 一 个 消息 给 目标 设备 时 有 效 
-RST 复位 : 所 有 设备 的 控制 器 从 总 线 上 断 开 并 恢复 为 初始 状态 


SCSI 总 线 操作 过 程 中 包括 的 主要 阶段 有 仲裁 、 选 择 、 信 息 传送 和 重 选 。 下 面 我 们 将 逐一 介绍 
这 些 阶 段 。 

仲裁 

当 一 BSY 信 号 无 效 时 (高 电 平 ) 总 线 空 闪 。 此 时 ， 任 何 控制 器 都 可 以 请 求 使 用 总 线 。 但 因为 
可 能 会 有 两 个 或 三 个 设备 同时 发 出 请 求 ， 所 以 必须 要 有 仲裁 机 构 。 控 制 器 请 求 总 线 时 启动 -BSY 
信号 ， 并 启动 与 它 相关 联 的 数据 线 来 识别 自己 。SCSI 总 线 使 用 简单 的 分 布 式 仲 裁 方式 。 图 4-42 对 
这 种 方式 进行 了 说 明 ， 在 该 图 中 2 号 到 6 号 控制 器 同时 请 求 使 用 总 线 。 

总 线 上 的 每 一 个 控制 器 都 分 配 有 一 个 固定 的 优先 级 、 其 中 控制 器 7 的 优先 级 最 高 。 当 - BSY 
有 效 时 ， 所 有 请 求 总 线 的 控制 器 检查 数据 线 来 确定 是 否 有 优先 级 更 高 的 设备 同时 在 请 求 总 线 。 
具有 最 高 优先 级 数据 线 的 控制 器 将 在 仲裁 过 程 中 获胜 。 然 后 所 有 其 他 设备 从 总 线 上 断 开 并 等 待 
一 BSY 信 号 再 次 变 成 无 效 。 

在 图 4- 和 2 中 ,假设 控制 器 6 是 启动 设备 要 求 与 控制 器 5 建立 连接 。 仲 裁 获胜 后 ， 控 制 器 6 进入 
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选择 阶段 识别 目标 设备 。 
月 标 设备 检查 ID 
DB2 
DB5 
DB6 
BSY 


SEL 





空闲 仲裁 选择 
图 4-42 SCSI 总 线 上 的 仲裁 和 选择 过 程 。 设 备 6 在 仲裁 中 获胜 且 设 备 2 被 选中 


选择 

获得 总 线 控制 权 后 ， 控 制 器 6 继续 保持 -BSY 和 - DB6 ( 它 的 地 址 ) 有 效 ， 接 着 它 通 过 启动 
一 SEL 和 一 DB5 信 号 表示 它 要 选择 控制 器 5。 所 有 其 他 参与 仲裁 过 程 的 控制 器 ， 如 图 中 的 控制 器 2， 
如 果 还 在 驱动 数据 线 的 话 ， 一 旦 - SEL 线 变 成 有 效 必须 停止 驱动 数据 线 。 目 标 控制 器 的 地 址 放 到 
总 线 上 后 ， 启 动 设备 释放 一 BSY 线 。 

通过 启动 -BSY 信 号 被 选 定 的 目标 控制 器 进行 响应 ， 这 个 信号 通知 启动 设备 它 请 求 的 连接 已 
经 建立 了 ， 这 样 启动 设备 就 可 以 从 数据 线 上 撤销 地 址 信息 。 至 此 选择 过 程 就 完成 了 ， 此 时 是 目标 
控制 器 (控制 器 5) -BSY 信 号 有 效 。 控制 器 5 控制 总 线 进入 信息 传送 阶段 。 

信息 传送 

两 个 控制 器 之 间 传 送 的 信息 包括 : 启动 设备 发 送 给 目标 设备 的 命令 、 目 标 设备 发 送 给 启动 设 
备 的 状态 信息 、 发 送 给 或 来 自 IO 设 备 的 数据 。 使 用 握手 信号 按照 4.5.2 节 描述 的 方式 控制 信息 传 
送 ， 此 时 目标 设备 是 总 线 主 控 器 。- REQ 和 - ACK 信 号 分 别 取代 图 4-26 和 图 4-27 中 的 主 控 就 绪 和 
从 动 就 绪 信 号 。 目 标 设备 在 输入 操作 (从 目标 设备 到 启动 设备 ) 期 间 启 动 -WO 信号 ， 还 可 能 启 
动 -CD 信号 表示 传送 的 信息 是 命令 或 状态 信息 而 不 是 数据 。 

应 该 指出 的 是 在 高 速 版 本 的 SCSI 总 线 中 引入 了 双边 沿 时 钟 或 双重 传输 (DT) 技术 。 在 图 
4-26 和 图 4-27 中 ， 每 一 次 数据 传送 都 需要 两 个 握手 信号 有 一 次 从 高 到 低 的 跳 变 ， 然 后 接着 一 次 从 
低 到 高 的 跳 变 。 双 边沿 时 钟 指 的 是 数据 在 这 些 信号 的 上 升 沿 和 下 降 沿 都 可 以 传送 ， 从 而 使 传输 速 
率 翻 倍 。 

在 传输 结束 时 ， 目 标 控制 器 释放 -- BSY 信 号 ， 从 而 释放 总 线 给 其 他 设备 使 用 。 稍 后 ， 当 准备 
好 更 多 要 传输 的 数据 时 ， 目 标 设备 要 重新 建立 与 启动 控制 器 的 连接 。 这 些 在 重 选 操作 中 完成 。 

重 选 

当 目 标 设 备 准备 好 恢复 被 中 断 的 逻辑 连接 时 ， 它 首先 需要 获取 总 线 控制 权 。 启 动 一 个 仲裁 周 
期 ， 并 在 仲裁 获胜 后 按 与 前 面 描述 一 样 的 方式 选 定 启动 控制 器 。 但 由 于 目标 设备 和 启动 设备 的 角 
色 已 经 调换 ， 所 以 此 时 启动 设备 启动 -BSY 信 号 。 在 数据 传送 开始 前 ， 启 动 设备 必须 把 控制 权 转 
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交 给 目标 设备 。 通过 使 目标 控制 器 在 选 定 启动 设备 后 启动 ~ BSY 信 号 来 完成 控制 权 的 转移 。 同 时 ， 
启动 设备 在 被 选 定 后 需要 等 待 一 小 段 的 时 间 来 确定 目标 设备 已 经 启动 ~- BSY 信 和 号， 然后 释放 
-BSY 线 。 现 在 两 个 控制 器 之 间 又 建立 了 连接 ， 目 标 设备 控制 总 线 继续 传输 数据 。 

上 面 描述 的 总 线 信 号 方式 为 两 个 控制 器 建立 逻辑 连接 和 交换 数据 提供 了 必需 的 机 制 。 这 个 连 
接 在 任何 时 候 都 可 能 被 中 断 和 重建 。SCSI 标 准 定义 了 各 种 类 型 信息 包 的 结构 和 内 容 ， 控 制 器 通过 
交换 这 些 信 息 包 来 处 理 不 同 的 情况 。 启动 设备 使 用 这 些 信息 包 发 送 它 从 处 理 器 接收 到 的 命令 给 目标 
设备 。 目 标 设备 响应 ， 将 状态 信息 发 送 给 启动 设备 并 执行 数据 传送 操作 。 其 中 后 者 是 在 目标 设备 的 
控制 下 进行 的 ， 因 为 只 有 目标 设备 知道 什么 时 候 数据 准备 好 了 ， 什 么 时 候 中 断 和 重建 了 连接 等 。 

SCSI 总 线 的 其 他 信息 和 各 种 SCSI 产 品 在 标准 委员 会 号 的 网 站 上 可 以 查 到 。 


4.7.3 通用 串 行 总 线 (USB) 


计算 机 和 通信 的 结合 是 当代 信息 技术 革命 的 核心 。 现 代 计 算 机 系统 一 般 都 包括 有 多 种 类 型 的 
设备 如 键盘 、 麦 克 风 、 照 相机 、 扬 声 器 和 显示 设备 。 大 部 分 计算 机 还 有 接 入 到 Internet 的 有 线 或 无 
线 连接 。 在 这 种 环境 中 ， 一 个 关键 的 要 求 就 是 能 提供 一 个 简单 、 廉 价 的 机 制 将 这 些 设备 连接 到 计 
算 机 上 ， 最 近 在 这 方面 的 一 个 重要 突破 就 是 通用 串 行 总 线 (USB) 外 的 推出 。 这 是 由 车 干 大 型 计 
算 机 和 通信 公司 协同 开发 出 来 的 一 种 工业 标准 ， 这 些 公司 包括 Compaq、Hewlett-Packard Intel. 
Lucent、Microsoft、Nortel Networks 和 Philips。 

USB 支 持 两 种 低速 (1.5Mb/s) 和 全 速 (12Mb/s) 的 操作 速度 。 在 最 近 修订 的 总 线 规范 
(USB 2.0) 中 还 引入 了 第 三 种 操作 速度 ， 称 为 高 速 (480Mb/s)。USB 很 快 就 被 市 场 接受 了 ， 并 和 且 
由 于 新 增 的 高 速 功能 它 已 成 为 大 部 分 计算 机 设备 的 选择 。 

USB 的 设计 达到 如 下 几 个 主要 目标 : 

“提供 一 个 简单 、 廉 价 、 使 用 方便 的 互 连 系统 ， 克 服 由 于 计算 机 只 能 提供 有 限 数量 的 IO 端口 

带 来 的 困难 。 

“能 够 满足 WO 设备 的 多 种 数据 传送 特性 ， 包 括 电 话 和 Intermet 连 接 器 。 

“采用 “ 即 播 即 用 ”的 操作 模式 ， 使 用 户 操作 更 加 方便 。 

在 讲述 USB 的 技术 细节 之 前 ， 我 们 先 详细 阐述 一 下 这 些 设计 目标 。 

端口 限制 

4.6 节 中 讲述 的 并 行 和 串 行 端口 为 多 种 低速 和 中 速 设备 连接 到 计算 机 提供 了 一 个 通用 的 连接 
点 。 但 在 实际 中 ， 一般 的 计算 机 只 提供 很 少 的 这 类 端口 。 为 增加 新 的 端口 ， 用 户 必须 打开 机 箱 将 
一 个 新 的 接口 卡 播 入 到 内 部 的 扩展 总 线 上 . 而 且 用 户 可 能 还 需要 知道 如 何 配置 设备 和 相应 的 软件 。 
USB 设 计 是 标 之 一 就 是 不 打开 机 箱 就 可 以 随时 添加 大 量 设备 到 计算 机 上 。 

设备 特性 

连接 到 计算 机 上 的 各 种 设备 其 功能 范围 非常 广泛 。 设 备 的 数据 传送 速度 、 容 量 和 时 序 限制 相 
差 都 非常 大 。 

在 键盘 上 ， 每 按 下 一 个 键 就 会 产生 一 个 字 节 的 信息 ， 而 且 随 时 都 可 能 发 生 。 这 些 信息 应 该 迅 
速 地 传送 给 计算 机 。 因 为 按键 事件 不 与 计算 机 系统 中 的 任何 其 他 事件 同步 ， 所 以 键盘 产生 的 数据 
是 异步 的 ， 并 且 又 受 操作 者 速度 的 限制 ， 所 以 产生 数据 的 速率 非常 低 ， 大 概 为 100 byte/s， 少 于 
1000 bit/s. 


计算 机 上 有 许多 简单 的 附属 设备 有 类 似 产生 数据 的 特性 一 -低速 和 异步 。 计 算 机 鼠标 和 在 视 


N 





194 £ 4 + 


频 游戏 中 使 用 的 控制 器 和 操纵 杆 就 是 很 好 的 例子 。 

下 面 看 另 一 种 类 型 的 数据 源 。 许 多 计算 机 都 有 外 带 的 或 内 置 的 麦克 风 。 这 个 由 麦克 风 接 收 到 
的 声音 产生 了 一 个 模拟 电信 和 号， 这 些 信号 必须 转换 成 数字 形式 才能 被 计算 机 处 理 。 通 过 周期 性 的 
对 模拟 信号 抽样 进行 转换 。 对 每 一 个 样本 ， 模 / 数 (A/D ) 转换 器 产生 一 个 4 位 的 数 表 示 样 本 的 量 
级 。 这 个 位 的 数量 "是 根据 要 求 的 采样 精度 来 选择 的 。 这 些 数据 送 到 扬声器 时 ， 再 使 用 一 个 数 / 模 
(D/A) 转换 器 将 数字 信号 转换 为 原来 的 模拟 信号 。 

抽样 过 程 将 产生 一 个 连续 的 数字 化 样本 流 ， 数 字样 本 的 间隔 和 采样 周期 同步 。 这 种 数据 流 被 
称 为 是 等 时 的 ， 指 的 是 连续 的 事件 被 相同 的 时 间 段 隔 开 了 。 

盲 号 必须 被 足够 高 的 频率 抽样 ， 以 记 下 它 的 最 高 频率 。 一 般 来 说 ， 如 果 抽 样 频率 为 每 秒 s 个 
样本 ， 采 样 过 程 能 够 捕捉 到 最 高 频率 是 s/2。 例 如 ， 用 8kHz 的 抽样 频率 对 人 说 话 声音 进行 采样 ， 
就 能 将 声音 信息 充分 捕捉 到 ， 声 音信 号 的 频率 最 高 可 达 入 Hz。 对 于 更 高 品质 的 声音 ， 如 在 音乐 系 
统 中 ， 需 要 使 用 更 高 的 采样 频率 。 数 字 声 音 的 一 种 标准 频率 是 44.1kHz。 每 一 个 样本 用 4 个 字 节 的 
数据 表示 以 满足 高 品质 声音 所 需 的 大 音量 范围 ( 声 强 范围 )。 这 将 产生 大 约 为 1.4MbAs 的 数据 传输 
速率 。 

在 处 理 采 样 的 声音 和 音乐 信号 时 ， 有 一 个 很 重要 的 要 求 就 是 在 采样 和 重 放 过 程 中 保持 精确 的 
时 序 。 高 度 的 拌 动 (样本 时 序 的 变化 ) 是 不 允许 的 。 因 此 ， 计 算 机 和 音乐 系统 之 间 的 数据 传送 机 
制 必须 保持 一 致 的 样本 间 延 迟 。 否 则 就 需要 引入 复杂 的 缓冲 和 重 定 序 电路 。 侦 尔 的 错误 或 样本 于 
失 是 可 以 接受 的 。 昕 者 可 能 完全 注意 不 到 ， 或 者 只 产生 不 引 人 注 意 的 滴答 声 。 并 不 需要 复杂 的 机 
制 来 确保 完全 正确 的 数据 传输 。 

图 像 或 视频 数据 的 传输 也 有 相似 的 要 求 ， 但 传输 带宽 要 高 得 多 。 带 宽 指 的 是 一 个 通信 通道 的 
总 数据 传输 能 力 ， 一 般 采 用 一 个 合适 的 单位 ， 比 如 用 每 秒 多 少 比 特 或 字 节 来 度量 。 为 了 保证 商用 
电视 的 图 像 质量 ， 一 张 图 片 需要 用 160kB 来 表示 ， 并 且 每 种 钟 发 送 30 帧 ， 即 44Mb/s 的 总 带宽 。 在 
高 品质 图 像 中 ， 如 HDTVY (高 清晰 度 电视 ) 会 要 求 更 高 的 传输 速率 。 

大 容量 存储 设备 如 硬盘 和 只 读 光 盘存 储 器 (CD-ROM) 的 要 求 与 以 上 内 容 不 同 。 这 些 设备 是 
计算 机 存储 器 结构 的 一 部 分 ， 将 在 第 5 章 中 介绍 。 它 们 到 计算 机 的 连接 必须 提供 至 少 40 或 50Mb/s 
的 数据 传输 速率 。 磁 盘 机 制 产生 的 延迟 约 为 1 毫秒 。 因 此， 向 计算 机 发 送 或 从 计算 机 中 接收 数据 
时 产生 的 较 小 额外 延迟 可 以 忽略 ， 也 不 用 考虑 抖动 。 

即 揪 即 用 

随 着 计算 机 的 普及 ， 它 们 的 形式 也 应 该 越 来 越 透明 。 例 如 ， 现 在 的 家 庭 影院 至 少 包含 一 台 计 
算 机 ， 而 人 们 使 用 家 庭 影院 时 ， 不 应 该 关闭 或 重启 计算 机 来 连接 或 断 开 影院 设备 。 

即 揪 即 用 特性 指 的 是 一 台新 设备 (如 附带 的 扬声器 ) 可 以 在 系统 运行 时 随时 连接 到 计算 机 上 。 
系统 应 该 能 够 自动 检测 到 新 设备 ， 识 别 相应 的 设备 驱动 软件 及 所 有 其 他 服务 这 台 设备 的 设施 ， 并 
分 配 适 当 的 地 址 ， 同 时 和 计算 机 建立 逻辑 连接 使 二 者 能 够 互相 通信 。 

即 插 即 用 的 要 求 涉及 系统 的 所 有 层次 ， 从 硬件 到 操作 系统 和 应 用 软件 。USB 设 计 的 一 个 主要 
目标 就 是 提供 即 插 即 用 功能 。 

USB 体 系 结构 

上 面 的 讨论 指出 了 对 具有 廉价 、 灵 活 和 高 数据 传输 带宽 的 互 连 系统 的 需求 。 并 且 ，1/O 设 备 
可 能 与 要 连接 的 计算 机 之 间 相 距 较 远 。 对 于 高 带宽 需求 ， 通 常 使 用 能 够 并 行 传送 8、16 或 更 多 位 
宽 的 总 线 。 但是， 大量 的 连 线 将 会 增加 成 本 和 复杂 度 ， 对 于 用 户 操作 也 不 方便 。 而且， 由 于 4.5.2 
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节 中 提 到 的 数据 相位 偏 移 问 题 也 很 难 设计 出 能 够 将 数据 传输 很 远 距离 的 宽 总 线 方式 。 相 位 偏 移 的 
数量 随 着 距离 的 增 大 而 增加 ， 这 将 限制 可 用 的 速率 。 

USB 选 择 的 是 品行 传输 格式 ,因为 串 行 总 线 具 有 廉价 和 灵活 性 。 时钟 和 数据 信息 一 起 被 编码 ， 
作为 单个 信号 来 传输 。 因 此 ， 串 行 总 线 没有 时 钟 频率 ， 也 不 存在 由 于 数据 相位 偏 移 导 致 的 距离 限 
制 。 因 此 可 以 通过 使 用 高 时 钟 频 率 来 提供 高 数据 传送 带宽 。 如 前 面 提 到 的 USB 提 供 三 种 不 同 的 位 
速率 ， 从 1.SMb/s 到 480Mb/s， 来 满足 不 同 的 IO 设备 。 

为 了 满足 随时 添加 或 删除 大 量 设备 的 需求 ，USB 使 用 了 图 4-43 所 示 的 树 形 结构 。 每 一 个 树 结 
点 都 有 一 个 集线器 ， 它 是 主机 和 IO 设备 之 间 的 中 间 控 制 点 。 在 树 的 根部 有 一 个 根 集 线 器 将 整 棵 树 
连接 到 主 计算 机 上 。 树 的 叶子 是 被 服务 的 IO 设备 〈 如 键盘 、Intermet 连 接 器 、 扬 声 器 或 数字 电视 )， 
它们 在 USB 术 语 中 称 为 功能 设备 。 为 了 与 本 书后 面 章节 保持 一 致 ， 将 这 些 设 备 称 为 JO 设 备 。 


| 二 计算 机 








图 4-43 通用 串 行 总 线 的 树 形 结构 


树 结构 保证 了 仅仅 使 用 简单 的 点 到 点 串 行 连接 就 可 以 将 大 量 设备 连接 到 计算 机 上 。 每 一 个 集 
线 器 都 有 很 多 连接 设备 的 端口 ， 这 些 设备 还 包括 其 他 集线器 。 在 正常 的 操作 中 ， 集 线 器 从 上 游 连 
接 接收 消息 ， 复 制 给 所 有 下 游 端 口 。 因 此 ， 主 计算 机 发 布 的 消息 可 以 广播 到 所 有 I/O 设 备 中 ， 但 
只 有 被 寻 址 的 设备 才 响 应 这 条 消息 。 就 这 一 方面 来 说 ，USB 的 功能 与 图 4-1 中 的 总 线 相同 。 但 是 ， 
与 图 4-1 不 同 的 是 1/O 设 备 的 消息 只 能 上 行 发 送 到 树 根 ， 而 其 他 设备 不 能 看 见 。 因 此 ，1/O 设 备 只 能 
与 主机 进行 通信 ， 不 能 与 其 他 IO 设备 进行 通信 。 

现在 来 看 一 下 树 型 结构 是 如 何 满足 USB 设 计 目 标的 。 树 型 结构 使 得 可 以 通过 很 少 的 端口 (H 
集线器 ) 就 可 以 将 大 量 的 设备 连接 到 计算 机 上 。 同 时 ， 每 台 IMO 设 备 通过 一 个 串 行 的 点 到 点 连接 
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和 计算 机 相连 。 这 是 便于 实现 即 插 即 用 特性 的 一 个 很 重要 的 思想 ， 后 面 将 简要 介绍 。 并 且 ， 由 于 
电气 传输 的 原因 ， 这 种 连接 上 的 串 行 数据 传输 要 比 图 4-1 中 的 总 线 上 的 并 行 传输 容易 得 多 。 串 行 
传输 中 ， 可 以 使 用 高 数据 传输 速率 和 长 电缆 。 

USB 的 操作 是 严格 基于 查询 的 。 设 备 只 有 在 响应 主机 查询 时 才 发 送 消息 。 因 此 ， 上 行 的 消息 
彼此 互 不 冲突 和 干扰 ， 因 为 没有 两 台 设 备 可 以 同时 发 送 消息 。 所 以 可 以 采用 非常 简单 和 廉价 的 集 
线 器 。 

不 管 是 全 速 还 是 低速 设备 都 必须 遵循 上 面 描述 的 操作 模式 。 但 是 ， 当 在 USB 2.0 版 本 中 引入 
了 高 速 操作 后 就 必须 引入 另 一 种 操作 模式 。 考 虑 图 4-.44 中 的 情况 ， 集 线 器 A 通 过 一 个 高 速 连接 器 
与 根 集线器 相连 。 这 个 集线器 连接 有 -一 台 高 束 
设备 C 和 一 台 低速 设备 D。 通 常 给 设备 D 的 消 
息 是 从 根 集线器 低速 发 送 的 ， 速 度 为 1.5Mb/s， 
因此 即使 一 条 很 短 的 消息 也 需要 花费 数 十 微 
秒 .在 这 条 消息 期 间 不 能 进行 其 他 的 数据 传送 ， 
因此 就 降低 了 高 速 连接 的 效率 ， 还 会 产生 高 速 
设备 不 可 接受 的 延迟 。 为 缓和 该 问题 ，USB 规 
范 规定 在 高 速 连 接 上 传送 的 数据 必须 总 是 高 速 
传送 的 ， 即 使 最 终 接 收 者 是 一 台 低速 设备 。 因 
此 ， 给 设备 D 的 消息 将 高 速 地 从 根 集线器 发 送 
到 集线器 A， 然 后 继续 低速 地 传送 至 设备 D。 
后 一 段 传送 将 要 花费 较 长 的 时 间 ， 在 这 期 间 到 N 
其 他 结 点 的 高 速 传输 可 以 继续 进行 。 例 如 ， 当 ` 
低速 消息 从 集线器 A 发 送 色 设备 D 时 ， 根 集 线 À 
器 可 能 已 经 与 设备 C 交 换 了 好 几 条 消息 。 在 这 
段 时 间 里 ， 总 线 被 认为 拆 分 成 了 高 速 和 低速 两 
种 运行 。 在 给 设备 D 消 息 之 前 和 之 后 都 有 专门 图 4-44 拆 分 总 线 操作 
的 指令 发 送 给 集线器 A， 分 别 来 启动 和 终止 拆 分 传输 操作 模式 。 

USB 标 准 规定 了 USB 互 连 的 硬 部 件 细节 ， 以 及 主机 软件 的 组 织 和 要 求 。USB 软 件 为 应 用 软件 
和 I/O 设 备 提供 双向 连接 。 这 些 连 接 称 为 管道 。 数 据 在 管道 的 一 端 输 入 ， 在 管道 的 另 一 端 移交 。 
寻 址 、 时 序 或 错误 检测 和 恢复 等 问题 由 USB 协 议 处 理 。 

在 4.2.6 节 提 到 负责 传输 发 送 给 或 来 自 /O 设 备 数 据 的 软件 称 为 设备 的 驱动 程序 。 设 备 驱动 程 
序 依赖 于 它 支持 的 设备 特性 。 因 此 ， 更 准确 地 说 ，USB 管 道 是 负责 连接 1/O 设 备 和 驱动 程序 的 。 
当 一 台 设 备 与 计算 机 相连 时 ， 并 且 USB 软 件 分 配给 它 惟一 的 地 址 空间 后 ， 管 道 便 被 建立 起 来 了 。 
之 后 数据 随时 都 可 以 从 这 个 管道 中 流 过 。 

下 面 分 析 一 下 在 USB 总 线 上 设备 是 如 何 被 寻 址 的 ， 然 后 讨论 数据 传送 的 各 种 方式 。 

Sk 

在 前 面 对 输 入 输出 操作 的 讲述 中 ， 提 到 在 一 艇 情况 下 ， 是 通过 分 配给 1/O 设 备 惟一 的 存储 器 
地 址 来 标识 它们 的 。 实 际 上， 一 台 设备 通常 有 好 几 个 可 寻 址 的 地 址 ， 来 使 软件 发 送 和 接收 控制 和 
状态 信息 并 传送 数据 。 

当 USB 总 线 连接 到 主 计算 机 上 时 ， 它 的 根 集线器 连接 到 处 理 器 总 线 上 ， 看 起 来 就 像 是 一 个 单 
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台 设 备 一 样 。 主 机 软件 与 连接 到 USB 上 的 每 一 台 设 备 通过 发 送信 息 包 进 行 通信 ， 根 集线器 收 到 信 
息 包 后 接着 将 它 发 送 给 USB 树 中 的 相应 设备 。 

USB 上 的 每 一 台 设 备 一 一 集线器 或 IO 设 备 ， 都 分 配 有 一 个 7 位 的 地 址 。 这 个 地 址 是 USB 树 的 
局 部 地 址 ， 与 处 理 器 总 线 上 使 用 的 地 址 没有 任何 关系 。 一 个 集线器 可 以 连接 任意 数量 的 设备 和 集 
线 器 ， 地 址 的 分 配 是 任意 的 。 当 一 台 设 备 第 一 次 连接 到 集线器 上 或 被 启动 时 ， 它 的 地 址 为 0。 集 
线 器 中 连接 这 台 设 备 的 硬件 可 以 检测 到 该 设备 已 经 连接 上 了 ， 并 记 下 该 事实 作为 自己 状态 信息 的 
一 部 分 。 主 机 周期 地 查询 每 一 个 集线器 来 收集 状态 信息 ， 了 解 是 否 有 新 增 或 被 删除 的 设备 。 当 主 
机 知道 连接 了 一 台新 设备 后 , 给 相应 的 集线器 端口 发 送 一 个 复位 的 指令 序列 ， 从 设备 处 读 取信 息 ， 
然后 向 设备 发 送 配 置信 息 ， 并 为 设备 分 配 一 个 惟一 的 USB 地 址 。 这 些 动作 完成 后 ， 设 备 就 开始 正 
常 工作 并 只 响应 该 新 地 址 了 。 

上 面 描述 的 初始 连接 过 程 是 支持 USB 的 即 插 即 用 功能 的 一 个 关键 特性 。 这 个 过 程 完全 由 主机 
软件 控制 。 主 机 软件 可 以 检测 到 已 经 连接 上 的 设备 ， 读 取 有 关 设 备 的 信息 ， 这 些 信息 通常 存储 在 
设备 硬件 中 一 个 很 小 的 只 读 存 储 器 中 ， 并 发 送 配置 设备 的 指令 来 允许 和 禁止 某 些 特性 和 功能 ， 最 
后 给 设备 分 配 一 个 惟一 的 USB 地 址 。 惟 一 需要 用 户 做 的 是 将 设备 插 人 到 集线器 的 端口 中 并 打开 电 
源 开 关 。 

当 一 台 设 备 被 关闭 时 ， 也 有 一 个 类 似 的 过 程 。 相 应 的 集线器 将 这 个 事实 报告 给 USB 系 统 软件 ， 
然后 系统 软件 更 新 它 的 设备 表 。 当 然 ， 如 果断 开 的 设备 本 身 是 一 个 集线器 ， 所 有 通过 该 集线器 与 计 
算 机 连接 的 设备 都 必须 记录 为 断 开 。USB 软 件 必 须 随时 保持 总 线 拓 扑 和 所 有 连接 设备 的 完整 映像 。 

设备 中 能 够 进行 数据 传输 的 位 置 ， 如 状态 、 控 制 和 数据 寄存 器 ， 称 为 端点 ， 它 由 一 个 4 位 的 
编码 来 识别 。 实 际 上 ， 每 一 个 4 位 的 数值 标识 一 对 端点 ， 一 个 用 于 输入 ， 另 一 个 用 于 输出 。 因 此 ， 
一 台 设 备 最 多 可 以 有 16 对 输入 /输出 端点 。 一 个 双向 数据 传送 的 USB 管 道 与 一 对 端点 相连 。 连接 0 
号 端点 的 管道 任何 时 候 都 存在 ， 包 括 设备 启动 或 复位 后 的 瞬间 。 它 是 USB 软 件 在 启动 过 程 中 使 用 
的 控制 管道 。 在 启动 过 程 中 ， 使 用 其 他 端点 对 的 管道 也 可 能 被 建 世 这 取决 于 设备 的 需要 和 复杂 
性 。4 位 端点 编码 将 作为 主机 寻 址 信息 的 … 部 分 被 发 送 ， 后 面 会 做 简要 的 介绍 。 

USB 协 议 

USB 上 传输 的 所 有 信息 都 被 组 织 成 包 的 形式 ， 一 个 包 由 一 个 或 多 个 字 节 组 成 。 包 的 种 类 很 多 
分 别 执行 不 同 的 功能 。 我 们 将 通过 列举 一 些 主要 类 型 包 的 例子 来 解释 USB 的 操作 并 说 明 如 何 使 用 
它们 。 

USB 上 传输 的 信息 可 以 被 分 成 两 大 类 : 控制 和 数据 。 控 制 包 执 行 寻 址 设备 启动 数据 传送 、 应 
答 数据 已 经 被 正确 接收 和 指示 一 个 错误 等 任务 。 数 据 包 运载 转交 给 设备 的 信息 。 例 如 ， 输 入 和 输 
出 数据 就 是 在 数据 包 中 传输 的 。 

一 个 包 由 一 个 或 多 个 包含 有 不 同类 型 的 信息 字段 组 成 。 第 一 个 字段 存放 包 的 识别 码 PID， 它 
标识 包 的 类 型 。 有 4 位 信息 ， 它 们 需要 传输 两 次 。 第 一 次 传送 的 是 它们 的 真实 值 ， 第 二 次 传送 的 是 
每 一 位 的 补 码 ， 如 图 4-45a 所 示 。 这 样 接收 设备 能 够 进行 校 验 ， 确 认 是 否 已 经 收 到 了 正确 的 PID 值 。 

4 位 PID 码 可 以 标识 16 种 包 的 类 型 。 一 些 控制 包 如 ACK (应 答 ) 只 由 PID 字 节 组 成 。 用 于 控制 
数据 传送 操作 的 控制 包 称 为 标记 包 ， 它 的 格式 如 图 4-45b 所 示 。 标 记 包 从 PID 域 开始 ， 使 用 两 个 PID 
值 来 分 别 区 分 IN 信息 包 和 OUT 信 息 包 ， 它 们 分 别 控制 输入 和 输出 数据 传输 。PID 域 的 后 面 是 7 位 设 
备 地 址 和 该 设备 内 的 4 位 端点 编号 。 包 中 的 后 5 位 为 错误 校 验 ， 使 用 循环 元 余 校 验 法 (CRC). CRC 
位 是 根据 地 址 和 端点 域 的 内 容 计算 出 来 的 。 接 收 设备 执行 逆 运 算 ， 确 定 接收 到 的 包 是 否 正确 。 
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. — Cr 
TPID [PD [PID PID; | PIDo | PID, | PID, PiD, 
—— he PID, | Pip, | PID | PID, | PD, | PID; | 


a) 信息 包 识别 字段 





b) 包 标 记 为 IN 或 OUT 


位 | 8 | 0 到 8192 | 16 | 





c) 数据 包 


图 4-45 USB 包 格式 
数据 包 传输 输入 和 输出 数据 ， 格 式 如 图 4-45c 所 示 。 识 别 字段 之 后 最 多 可 存放 8192 位 数据 ， 


最 后 是 16 位 错误 校 验 位 。 有 三 种 不 同 的 PID 格 式 用 来 标识 数据 包 ， 因 此 数据 包 可 以 编号 为 0、1、2 


这 三 种 。 需 要 注意 的 是 数据 包 不 包含 设备 地 址 和 端点 编号 ， 这 些 信 息 包含 在 启动 传送 的 IN 或 OUT 
令 牌 包 中 。 

考虑 一 台 连 接 到 USB 集 线 器 的 输出 设备 ， 该 集线器 被 连接 到 主 计算 机 上 。 图 4-46 显 示 了 一 个 
输出 操作 的 例子 。 主 计算 机 发 送 一 个 OUT 类 型 的 标记 包 给 集线器 ， 接 着 发 送 一 个 包含 有 输出 数据 
的 数据 包 . 数据 包 的 PID 域 标记 它 是 一 个 0 号 数据 包 。 集线器 通过 校 验 错误 控制 位 确认 传输 无 误 后 ， 
发 送 一 个 应 答 包 (ACK) 给 主机 。 集 线 器 继续 将 标记 和 数据 包 往 下 传送 。 所 有 IO 设备 都 将 会 接 
收 到 这 些 包 序列 ， 但 只 有 在 标记 包 中 识别 出 自己 地 址 的 设备 才 接 受 后 面包 中 的 数据 。 确 认 传送 无 
误 后 ， 设 备 发 送 ACK 包 给 集线器 。 

全 速 或 低速 管道 中 的 连续 数据 包 交 替 使 用 0 号 和 1 号 类 型 数据 包 。 这 样 在 发 生 错误 传输 时 ， 比 较 容 
易 恢复 。 如 果 一 个 标记 、 数 据 或 应 答 包 由 于 传输 错误 丢失 了 ， 发 送 者 重 发 整个 包 序列 。 通 过 检查 PID 
区 域 中 的 数据 包 编号 ， 搂 收 者 可 以 检测 并 丢弃 重复 包 。 高 速 数据 包 按 顺序 循环 编号 为 0、1、2、0、….。 

输入 操作 也 遵循 一 个 类 似 的 过 程 。 主 机 发 送 一 个 包含 设备 地 址 的 IN 类 型 的 标记 包 。 实 际 上 这 
是 一 次 查询 ， 要 求 设备 将 它 现 有 的 输入 数据 发 送 给 主机 。 设 备 发 送 一 个 数据 包 给 主机 进行 响应 ， 
然后 发 送 一 个 ACK 包 。 如 果 设 备 没有 准备 好 的 数据 ， 它 就 发 送 一 个 否认 (NAK) 包 。 

在 前 面 的 叙述 中 ,我们 指出 既 有 全 /低速 连接 又 有 高 速 连接 的 总 线 使 用 拆 分 传输 操作 模式 ， 
来 保证 高 速 连接 上 的 消息 不 被 延迟 。 在 这 种 情况 下 ， 在 向 全 速 或 低速 设备 发 送 IN 或 OUT 包 之 前 有 
一 个 专门 的 控制 包 启 动 拆 分 传输 模式 。 

现在 大 家 应 该 对 USB 上 的 数据 传送 协议 有 所 了 解 了 。 上 述 事务 可 以 按照 不 同 的 方法 执行 ， 并 
有 许多 协议 规则 管理 设备 的 行为 。 有 关 USB 协 议 更 详细 的 描述 请 参看 USB 协 议 说 明 书 ma。 





_ Agua — 四 


"n 集线器 MO 设备 
标记 | 
Data 一 
I | ACK 
时 间 | 一 一 T 
a 标记 
Data | TS 
| ACK 
标记 | 
Datat |. T . 
a ~| ax 
aa 标记 忆 
Datal | > 
| ack 
图 4-46 一 次 输出 传输 
USB 上 的 等 时 传输 


USB 的 一 个 主要 目标 是 支持 以 简单 的 方式 传输 等 时 数据 ， 如 被 采样 的 声音 。 产 生 或 接收 等 时 
数据 的 设备 需要 有 时 间 参 考 来 控制 采样 过 程 。 为 了 提供 这 个 参考 ，USB 上 的 数据 传输 被 划分 成 等 
长 度 的 帧 。 对 于 全 速 和 低速 数据 一 帧 就 是 Ims。 根 集线器 每 lms 精 确 地 产生 一 个 起 始 帧 控制 包 
(SOF) 来 标识 新 帧 的 开始 。 

SOF 包 到 达 任 何 设备 都 可 以 作为 一 个 标准 的 时 钟 信号 被 设备 利用 。 为 了 支持 需要 更 长 时 间 周 
期 的 设备 ，SOF 包 有 11 位 的 帧 编号 ， 如 图 4-47a 所 示 。SOF 包 之 后 ， 主 机 对 等 时 设备 进行 输入 输出 
传送 。 这 样 每 台 设备 每 1ms 就 有 一 次 机 会 进行 输入 输出 传输 。 

等 时 传输 的 主要 要 求 是 一 致 的 时 序 。 偶 尔 的 错误 可 以 接受 ， 因 此 不 需要 重 发 委 失 的 包 或 发 送 应 
答 包 。 图 4 47b 显 示 了 紧 跟 SOF 后 面 的 两 次 传输 。 包 含 设备 地 址 3 的 控制 包 之 后 是 发 送 给 该 设备 的 数据 ， 
输入 或 输出 数据 取决 于 控制 包 是 IN 还 是 OUT 类 型 。 这 里 没有 应 答 包 ， 下 一 个 传输 序列 是 给 设备 7 的 。 

举 一 个 例子 ， 假 设 给 设备 3 的 数据 包 中 包含 8 个 字 节 的 数据 。 如 果 等 时 通道 的 速率 为 64kb/s， 
那么 在 每 一 帧 中 可 以 发 送 一 个 包 。 这 种 通道 可 以 用 于 声音 连接 。 传 输 8 个 字 节 的 数据 需要 3 个 字 书 
的 标记 包 ， 其 后 面 紧 接着 11 字 节 的 数据 包 (包括 PID 和 CRC 区 域 )， 总 共 132 位 。 此 外 ， 至 少 还 需 
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要 3 个 字 节 用 于 时 钟 同 步 和 标识 包 序列 结束 。 在 12Mb/s 的 速度 下 ， 将 花费 13s。 很 明显 ， 一 帧 中 可 
以 支持 几 台 这 样 的 设备 。 在 服务 完 总 线 上 的 所 有 等 时 设备 后 ， 帧 中 剩余 的 时 间 可 以 用 来 服务 异步 
设备 ， 交 换 控制 和 状态 信息 。 
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A 一 ACK 包 
b) 帧 举例 


图 4-47 USB 的 帧 


等 时 数据 只 人 允许 在 全 速 和 高 速 连接 上 传输 。 在 高 速 连 接 中 ，SOF 包 在 lms 内 等 间隔 地 重复 8 次 
形成 8 个 125ps 的 微 帧 。 
电气 特性 
USB 连 接 使 用 的 电缆 由 4 根 电线 组 成 。 其 中 两 根 用 来 连接 电源 +5V 和 地 。 因 此 ， 和 集线器 或 1/O 
282) ”设备 可 能 直接 从 总 线 获得 能 源 ， 也 可 以 使 用 独立 的 外 部 电源 。 另 外 两 根 电线 用 于 传输 数据 。 不 同 
速度 的 传输 使 用 的 信号 方式 不 同 。 在 低速 传输 中 ， 通 过 在 两 条 信号 线 中 的 一 条 上 发 送 高 电 平 
(5V)， 分 别 表示 发 送 1 和 0。 在 高 速 连 接 中 使 用 的 是 差分 传输 。 


4.8 结束 语 


本 章 中 讲述 了 三 种 基本 的 MO 传输 方式 。 最 简单 的 技术 是 程序 控制 输入 输出 ， 在 这 种 技术 中 
处 理 器 在 程序 指令 的 直接 控制 下 执行 所 有 需要 的 控制 功能 。 第 二 种 方式 是 基于 中 断 的 ; 这 种 机 制 
可 以 中 断 现 有 程序 的 执行 ， 转 去 服务 具有 更 高 优先 级 的 请 求 ， 这 些 请 求 是 更 需要 迫切 处 理 的 。 虽 
然 所 有 计算 机 都 有 处 理 这 种 情况 的 机 制 ， 但 是 不 同 计算 机 的 中 断 处 理 系统 的 复杂 程度 是 不 同 的 。 
第 三 种 WO 方式 是 直接 存储 器 访问 ; DMA 控 制 器 在 MO 设备 和 主 存 之 间 传 送 数据 ， 不 需要 处 理 器 的 
连续 干预 。 在 这 种 方式 中 ，DMA 控 制 器 和 处 理 器 共享 对 主 存 的 访问 。 

此 外 ， 还 讲述 了 三 种 流行 的 互 连 标 准 : PCI、SCSI 和 USB。 它 们 分 别提 供 不 同 的 方法 来 满足 
各 种 不 同 设备 的 需求 ， 还 反映 了 提高 使 用 方便 性 的 即 播 即 用 特性 的 重要 性 。 


习题 
4.1 一 旦 输入 数据 缓冲 区 被 读 取 ， 接 口 电 路 中 输入 状态 位 就 被 清空 。 为 什么 要 这 么 做 ? 
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4.2 


4.3 


4.4 
4.5 


4.6 


4.7 


4.8 


4.9 


写 一 个 程序 ， 在 视频 显示 器 上 以 16 进 制 形 式 显 示 主 存 中 10 个 字 节 的 内 容 。 使 用 你 选择 的 处 理 
器 的 汇编 指令 或 伪 指 令 。 从 存储 器 LOC 位 置 开 始 ， 每 个 字 节 用 两 个 16 进 制 字 符 表 示 。 连 续 的 
字符 用 空格 隔 开 。 

计算 机 有 16 根 地 址 线 ，Aks -o。 如 果 分 配给 一 台 设 备 的 地 址 是 7CA4,e， 并 且 该 设备 地 址 译 码 器 
忽略 As 和 As 两 根 线 。 这 人 台 设 备 将 对 哪些 地 址 进行 响应 ? 

子 程序 与 中 断 服 务 程 序 的 区 别 是 什么 ? 

在 这 一 章 中 我 们 假定 只 有 等 到 当前 机 器 指令 执行 完成 后 中 断 才 被 响应 。 考 虑 在 处 理 器 正在 执 
行 一 条 指令 时 中 断 它 的 操作 来 响应 一 个 中 断 的 可 行 性 。 讨 论 一 下 可 能 产生 的 问题 。 

三 台 设 备 A、B、C 连 接 到 计算 机 总 线 上 。 所 有 设备 的 MO 传送 都 由 中 断 控 制 。 对 于 设备 A 和 
B 不 允许 中 断 嵌 套 ， 但 C 的 中 断 请 求 在 服务 A 或 B 时 可 以 被 接受 。 在 下 列 情况 中 给 出 不 同 的 实 
现 方法 : 

(a) 计算 机 只 有 一 根 中 断 请 求 线 。 

(b) 计算 机 有 两 根 中 断 请 求 线 INTR1 和 INTR2，HTR1I 的 优先 级 高 一 些 。 

说 明 在 每 种 情况 下 中 断 在 何 时 发 生 ， 如 何 被 允许 和 禁止 。 

一 台 计 算 机 中 有 几 台 设备 连接 到 一 根 公共 中 断 请 求 线 上 ， 如 图 4-8a 所 示 。 请 问 你 将 如 何 安排 ， 
使 设备 j 的 中 断 请 求 在 设备 i 的 中 断 服务 程序 执行 完 前 被 接受 。 尤 其 当 这 个 系统 中 有 的 点 上 
允许 中 断 ， 有 的 点 上 禁止 中 断 时 。 

考虑 图 4-8a 中 的 菊花 链 结构 。 假 设 一 台 设 备 产生 中 断 请 求 后， 一旦 接收 到 中 断 应 答 信号 它 就 
将 请 求 撤销 。 那 在 进入 中 断 服务 程序 之 前 ， 是 否 还 需要 在 处 理 器 中 禁止 中 断 ? 为 什么 ? 

从 一 台面 向 字符 的 输入 设备 读 取 连 续 的 数据 块 ， 每 个 数据 块 有 N 个 字 节 。 程 序 PROG 对 每 一 
块 数据 执行 一 些 计算 。 分 别 为 68000、ARM 和 Pentium 处 理 器 写 一 个 控制 程序 CONTROL， 执 
行 以 下 任务 : 

(a) 读 取 数据 块 1。 

(b) 启动 PROG 程 序 并 指向 主 存 中 第 1 块 的 位 置 。 

(c) 当 PROG 对 块 1 执 行 计 算 时 ， 使 用 中 断 读 取 数 据 块 2。 

(d) 对 数据 块 2 启动 PROG ， 同 时 开始 读 取 块 3， 如 此 继续 。 

需要 注意 的 是 ，CNTRL 必 须 保持 正确 的 缓冲 区 指针 ， 记 录 下 字符 数 ， 并 正确 地 将 控制 权 转 
交 给 PROG， 不 管 PROG 比 数据 块 输入 花费 的 时 间 多 还 是 少 。 


410 有 一 台 计算 机 ， 要 求 它 从 20 台 视频 终端 接收 字符 。 指 针 PNTRm 指 向 用 于 存储 每 一 台 终 端的 


数据 的 主 存 区 域 ，n 从 1 到 20。 当 另 一 个 程序 PROG 正 在 执行 时 ， 终 端的 输入 数据 必须 被 收集 
起 来 。 这 可 以 由 如 下 两 种 方法 实现 : 

(a) ÆT 秒 钟 程序 PROG 调 用 一 个 测试 子 程序 POLL。 这 个 子 程序 按 顺 序 查 询 所 有 20 台 终端 的 
状态 并 将 所 有 输入 数据 传送 到 存储 器 ， 然 后 返回 PROG。 

(b) 当 任 何 终端 的 接口 缓冲 区 中 有 就 绪 的 字符 时 ， 产 生 一 个 中 断 请 求 ， 然 后 中 断 服务 程序 
INIERRUPT 被 执行 。 在 查询 完 状态 寄存 器 后 ，INTERRUPT 传 送 输入 字符 然后 返回 PROG。 
使 用 伪 代 码 或 选择 的 处 理 器 的 汇编 语言 编写 程序 POLL 和 INTERRUPT。 假 设 所 有 终端 的 最 
大 字符 获取 速率 为 c 个 字符 每 种， 平均 速率 等 于 rc，r 小 于 等 于 1。 在 方法 (a) 中 ， 能 够 保证 不 
丢失 输入 字符 的 7 的 最 大 值 是 多 少 ? 在 方法 (b) 中 的 等 价 7 值 又 是 多 少 ” 估 计 一 下 , 在 c= 100, 
7 分 别 为 0.01、0.1、0.5、1 时 ， 方 法 (a) 和 (b) 中 服务 终端 的 平均 时 间 百 分 率 是 多 少 。 假 设 
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POLL 花 费 800 纳 秒 查 询 20 台 设备 ， 处 理 设备 的 中 断 需 要 200 纳 秒 。 


4.11 有 一 台 LIO 设 备 ， 它 使 用 68000 处 理 器 的 向 量 中 断 功能 。 


4.12 


4.13 


4.14 


4.15 


(a) 描述 一 下 当 处 理 器 接收 到 一 个 中 断 请 求 时 采取 的 步 又 序列 ， 并 给 出 这 些 步 又 中 要 求 的 总 
线 传送 的 编号 。 不 需要 给 出 总 线 信号 和 微 程序 细节 。 
(b) 当 接 收 到 一 个 中 断 请 求 时 ， 在 接受 中 断 前 处 理 器 要 完成 当前 指令 的 执行 。 分 析 附 录 C 中 
的 指令 表 ， 然 后 估计 一 下 这 期 间 可 能 发 生 的 存储 器 传输 的 最 大 数量 。 
(c) 估计 一 下 从 设备 请 求 中 断 起 到 中 断 服务 程序 的 第 一 条 指令 被 取出 执行 期 间 可 能 出 现 的 总 
线 传输 数量 。 
需要 一 个 逻辑 电路 来 实现 图 4-8b 所 示 的 优先 级 系统 。 这 个 系统 处 理 三 条 中 断 请 求 线 。 当 在 
INTRi 按 收 到 一 个 请 求 后， 系统 在 INTAi 线 上 产生 一 个 应 答 信号 。 如 果 收 到 的 请 求 多 于 一 个 ， 
只 响应 最 高 优先 级 的 请 求 ， 优 先 级 顺序 为 
INTR1 的 优先 级 > INTR2 的 优先 级 > INTR3 的 优先 级 
(a) 分 别 给 出 INTA1、INTA2 和 INTA3 三 个 输出 的 真 值 表 。 
(b) 给 出 一 个 实现 该 优先 级 系统 的 逻辑 电路 。 
(c) 你 的 设计 是 否 能 够 方便 地 扩充 到 更 多 的 中 断 请 求 线 ? 
(d) 通过 添加 输入 DECIDE 和 RESET， 修 改 你 的 设计 。 当 输入 DECIDE 接 收 到 一 个 脉冲 时 ， 
INTA; 被 置 1， 在 输入 RESET 接 收 到 脉冲 时 被 重 置 为 0。 
中 断 和 总 线 仲 裁 需要 一 个 根据 优先 级 进行 选择 的 机 制 。 设 计 一 个 电路 ， 有 四 根 输入 线 ， 且 
为 REQ1 到 REQ4 的 轮转 优先 级 方式 。 起 初 ，REQ1 的 优先 级 最 高 ，REQ4 的 优先 级 最 低 。-- 
根 请 求 线 被 服务 后 ， 它 的 优先 级 变 成 最 低 ， 下 一 根 请 求 线 获得 最 高 优先 级 。 例 如 ， 在 REQ2 
被 服务 后 ， 优 先 级 顺序 从 高 到 低 依次 为 REQ3、REQ4、REQ1、REQ2。 要 求 有 四 个 输出 人 
许 信 号 GR1 到 GR4， 每 根 输入 请 求 线 对 应 一 个 。 当 DECIDE 线 上 接收 到 一 个 脉冲 时 其 中 一 根 
输出 线 被 置 位 。 
68000 处 理 器 有 一 个 三 线 组 PL2-0， 用 于 产生 中 断 请 求 信号 。 这 些 线 组 成 一 个 3 位 二 进 制 编 
号 ， 处 理 器 认为 它 代表 优先 级 最 高 的 中 断 请 求 设备 。 设 计 一 个 优先 级 编码 电路 ， 从 7 台 设 备 
接收 中 断 请 求 ， 并 产生 一 个 3 位 的 代码 表示 优先 级 最 高 的 请 求 。 
(本 题 适合 做 实验 室 实验 ,) 假设 有 一 台 视 频 终端 连接 到 你 实验 室 的 计算 机 上 ， 完 成 如 下 两 
个 任务 。 
(a) 写 一 个 按 字母 表 顺 序 打 印字 母 的 HO 程 序 A。 它 打印 如 下 的 两 行 ， 然 后 停止 : 
ABC,…YZ 
ABC…YZ 

(b) 写 一 个 IO 程序 B， 它 按 递增 顺序 打印 数字 字符 0 到 9 三 遍 。 它 的 输出 格式 如 下 : 

012…9012…9012…9 
将 程序 A 作 为 主 程序 ， 程 序 B 作 为 中 断 服务 程序 ，B 由 在 键盘 上 输入 一 个 字符 启动 执行 。 程 
序 B 的 执行 也 可 以 被 键盘 上 输入 的 另 一 个 字符 中 断 。 当 程序 B 完 成 后 ， 最 近 被 中 断 的 程序 在 
中 断 点 重新 开始 执行 。 程 序 B 应 该 适当 的 另 起 一 行 以 使 打印 输出 有 如 下 的 格式 : 

ABC 

012---901 

012…9012…9012…9 
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2...9012...9 

DE…YZ 
另 起 一 行 时 ， 程 序 需要 发 送 两 个 字符 : CR(ODiej 和 LEF(OAIej。 如 何 使 用 处 理 器 优先 级 来 允许 
和 禁止 中 断 嵌 套 ? 
(本 题 适合 做 实验 室 实 验 。 ) 在 习题 4.15 中 ， 当 一 个 字符 序列 的 打印 被 中 断后 重新 开始 执行 
时 ， 字 符 序列 在 新 行 的 起 始 位 置 接着 打印 。 在 这 里 我 们 要 求 添加 光标 移动 控制 功能 ， 保 证 
重新 打印 字符 序列 时 ， 字 符 在 新 行 中 的 打印 位 置 与 发 生 中 断 前 打印 该 字符 的 位 置 相同 。 因 
此 ， 打 印 输出 将 有 如 下 格式 : 

ABC 

012…901 

012…9012…9012…9 

DE.…YZ 
重新 设计 你 的 程序 ， 使 得 在 中 断 出 现时 进入 第 三 个 控制 程序 C。 这 个 程序 调用 程序 B 打 印 数 
字 序 列 。 然 后 在 返回 被 中 断 程序 前 ， 发 布 适当 的 光标 移动 指令 移动 光标 。 
考虑 4.2.5 节 中 描述 的 断 点 方式 。 在 断 点 插入 的 位 置 用 一 条 软件 中 断 指 令 取代 程序 指令 。 在 
返回 原始 程序 之 前 ， 调 试 程序 将 原始 程序 的 指令 放 回 原 处 ， 删 除 断 点 。 请 问 调试 器 是 如 何 
将 原始 程序 指令 放 回 原 处 ， 执 行 该 指令 ， 并 在 其 他 程序 指令 执行 之 前 再 次 插入 断 点 的 ? 
ARM 的 软件 中 断 指令 SWI 可 以 被 程序 用 来 调用 操作 系统 请 求 某 些 服务 。 请 求 的 服务 由 这 条 
指令 的 低 8 位 说 明 。 操 作 系 统 提供 的 每 一 个 服务 都 由 独立 的 子 程序 来 执行 ， 这 些 程序 的 起 始 
地 址 存储 在 一 个 表 中 。 
(a) 给 出 一 条 或 多 条 的 指令 ， 操 作 系 统 使 用 这 些 指令 将 SWI 指 令 的 低 8 位 复制 到 寄存 器 中 。 
(b) 给 出 一 条 或 多 条 指令 来 调用 适当 的 服务 程序 。 
在 某 一 应 用 中 ， 使 用 集 电极 开路 方式 的 中 断 请 求 线 传送 的 信号 是 所 有 相连 设备 的 请 求 的 逻 
辑 “ 或 "。 但 在 另 一 应 用 中 ， 要 求 这 条 线 产生 的 信号 表示 所 有 连接 到 总 线 的 设备 都 准备 就 绪 
了 。 请 问 如 何 使 用 集 电极 开路 方式 来 实现 ? 
一 些 计算 机 中 ， 只 有 在 中 断 请 求 线 的 前 说 处 理 器 才 响 应 。 如 果 有 两 台 相 互 独立 的 设备 连接 
到 这 条 线 上 将 会 发 生 什 么 情况 ? 
图 4-20 中 ， 只 有 当 它 的 总 线 允许 输入 线 上 收 到 一 个 由 低 到 高 的 跳 变 时 ， 设备 才能 成 为 总 线 
主 控 。 假 设 设备 1 请 求 总 线 并 获得 允许 。 当 它 正 在 使 用 总 线 时 ， 设备 3 启动 它 的 BR 输出 。 画 
出 设备 3 在 设备 1 释放 总 线 后 如 何 成 为 总 线 主 控 的 时 序 图 。 
假定 在 图 4-20 的 总 线 仲裁 机 构 中 ， 只 要 BR 有效， 处 理 器 就 保持 BG1 有 效 。 当 设 备 i 请 求 总 
线 时 ， 只 有 在 它 的 BGi 输 入 收 到 一 个 由 低 到 高 跳 变 时 ， 才 能 成 为 总 线 主 控 。 
(a) 假设 任何 时 候 设 备 都 可 以 启动 BR 信号 。 给 出 一 个 事件 序列 使 系统 会 进入 死 锁 ， 死 锁 时 
有 一 台 或 更 多 的 设备 请 求 总 线 ， 总 线 也 是 空闲 的 ， 但 没有 设备 能 够 成 为 总 线 主 控 。 
(b) 采用 什么 规则 来 防止 发 生死 锁 ? 
考虑 图 P4-1 的 菊花 链 结构 ， 总 线 请 求 信号 作为 总 线 允 许 音 号 被 直接 反馈 。 假 设 设备 3 请 求 了 


总 线 并 正在 使 用 总 线 。 当 设备 3 使 用 完 后 ， 使 BR3 无 效 。 假 设 在 任何 设备 中 从 BGi 到 BG G+1) (287 


的 延迟 都 为 4。 证明 一 个 假 总 线 允 许 脉 冲 可 以 从 设备 3 往 下 传送 ( 因为 该 脉冲 不 是 对 任何 请 
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求 的 响应 ， 所 以 称 为 “ 假 " )。 估 计 这 个 脉冲 的 宽度 。 


BGI [ ——— BGn 
k 
| + BR2 BRn 


图 P4-1 一 种 分 散 式 总 线 分 配方 案 


在 习题 4.23 中 的 设备 3 释放 总 线 后 不 和 久 ， 设 备 1 和 设备 5 同时 请 求 总 线 。 证 明 它 们 都 能 接收 到 
总 线 允 许 信号 。 

考虑 图 4-20 中 的 总 线 仲裁 方式 。 假 设 在 设备 接口 电路 中 有 一 个 本 地 信和 号 BUSREQ， 在 设备 
需要 使 用 总 线 时 置 1。 设 计 接口 电路 中 以 BUSREQ、BG; 和 BBSY 为 输入 ， 并 产生 BR 、 
BG (i+ 1)、BBSY 为 输出 的 那 部 分 。 

考虑 图 4-22 中 的 总 线 仲裁 电路 。 假 设 设备 的 优先 级 代码 存储 在 接口 电路 的 一 个 寄存 器 中 。 
设计 一 个 电路 实现 这 种 仲裁 方式 。 当 Start- Arbitration 有 效 时 仲裁 开始 。 稍 后 ， 仲 裁 电路 应 
该 激活 在 仲裁 周期 中 获胜 者 的 输出 线 。 

如 果 处 理 器 与 IO 设备 之 间 的 距离 增加 了 ， 图 4-26 中 的 时 序 图 将 会 受到 什么 影响 ?在 图 4-24 
中 ， 如 何 才 能 适应 距离 的 增 大 ? 

一 家 工厂 使 用 几 个 受 限 传感器 来 监控 温度 、 压 力 和 其 他 参 素 。 每 个 传感器 的 输出 由 一 个 
ON/OFF 开 关 组 成 ，8 个 这 样 的 传感器 都 需要 连接 到 一 台 小 型 计算 机 的 总 线 上 。 设 计 一 个 接 
口 ， 使 8 个 开关 的 状态 可 以 作为 单个 字 节 从 地 址 FE10,e 同时 读 取 。 假 定 使 用 同步 总 线 且 使 用 
图 4-24 中 的 时 序 。 

设计 一 个 接口 在 同步 总 线 上 连接 一 个 七 段 显示 器 作为 输出 设备 。( 参 见 附录 A 中 的 图 A-37 对 
七 段 显示 器 的 描述 .) 

在 图 4-29 的 接口 中 添加 中 断 功 能 。 如 何 引 入 一 个 中 断 允 许 位 ， 共 作为 接口 状态 寄存 器 的 第 6 
位 可 以 被 处 理 器 置 位 和 清除 。 当 中 断 被 允许 且 有 数据 可 以 被 处 理 器 读 取 时 ， 接 日 应 该 启动 
中 断 请 求 线 INTR 。 

处 理 器 总 线 使 用 4.5.1 节 描述 的 多 周期 方式 。 存 储 单元 的 速度 可 以 使 读 操作 遵循 图 4-25 中 的 
时 序 图 。 设 计 一 个 接口 电路 将 存储 单元 连接 到 总 线 上 。 

考虑 总 线 上 的 一 次 写 操作 ， 该 总 线 使 用 4.5.1 节 描述 的 多 周期 方式 。 假 设 处 理 器 在 总 线 事务 
的 第 一 个 周期 就 能 将 地 址 和 数据 发 送 完 。 但 这 之 后 存储 器 还 需要 两 个 时 钟 周期 来 存储 数据 。 
(a) 在 后 两 个 时 钟 周期 ， 总 线 是 否 可 以 用 于 其 他 事务 ? 

(b) 在 这 种 情形 中 我 们 是 否 可 以 取消 存储 器 的 响应 ? (提示 : 仔细 分 析 当 处 理 器 试图 对 存储 
块 进行 另 一 写 操作 时 ， 该 存储 块 仍 忙于 完成 前 一 次 请 求 的 情况 。 请 问 如 何 处 理 这 种 情况 ? ) 
图 4-24 到 图 4-26 提 供 了 三 种 不 同 的 总 线 设 计 方 法 。 如 果 被 寻 址 的 设备 由 于 故障 没有 响应 ， 请 
问 在 三 种 不 同方 法 下 会 发 生 什么 ?会 导致 什么 问题 ?3 有 什么 可 行 的 补救 方法 ? 

在 图 4-25 中 的 时 序 图 中 ， 处 理 器 在 总 线 上 保持 地 址 信号 直到 接收 到 设备 的 响应 信号。 这 是 
必需 的 吗 ? 如 果 处 理 器 只 在 一 个 周期 内 发 送 地 址 ， 设 备 端 需要 什么 附加 设施 ? 

有 一 条 同步 总 线 按照 图 4-24 中 的 时 序 图 工作 。 处 理 器 发 送 的 地 址 4ns 后 才能 在 总 线 上 出 现 。 
总 线 上 处 理 器 与 不 同 设备 之 间 的 传播 延迟 在 Ins 到 5ns 的 范围 内 ， 地 址 译 码 需要 花费 6ns， 被 
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寻 址 的 设备 需要 花费 5 到 10ns 的 时 间 将 请 求 的 数据 放 到 总 线 上 。 输 入 缓冲 区 需要 3ns 的 准备 
时 间 。 试 问 该 总 线 能 够 工作 的 最 大 时 钟 速度 是 多 少 ? 

436 在 图 4-26 中 ， 一 次 完整 的 总 线 传 输 需 要 的 时 间 随 着 延迟 不 同 而 不 同 。 有 一 条 和 习题 4.35 中 具 
有 相同 参数 的 总 线 。 请 问 它 的 最 大 和 最 小 总 线 周期 是 多 少 ? 


参考 文献 


1. PCI Local Bus Specifications, available at www.pcisig.com/developers. 


2. SCSI-3 Architecture Model (SAM), ANSI Standard X3.270, 1996. This and other 
SCSI documents are available on the web at www.ansi.org. 


3. Universal Serial Bus Specification, available at www.usb.org/developers. 





第 5 章 


存储 器 系统 


本 章 目标 


在 本 章 中 你 将 学 习 以 下 内 容 : 
“基本 的 存储 器 电路 

* 主 存储 器 的 组 织 结构 

“ 缩短 有 效 存储 器 访问 时 间 的 高 速 缓存 概念 
“ 增加 主 存储 器 表现 容量 的 虚拟 存储 器 机 制 
“ 用 于 辅助 存储 的 磁盘 、 光 盘 和 磁带 


程序 和 程序 操作 的 数据 保存 在 计算 机 的 存储 器 中 ， 在 这 一 章 我 们 将 讨论 计算 机 的 这 个 重要 
部 分 是 如 何 运作 的 。 到 目前 为 止 ， 读 者 已 经 了 解 到 程序 的 执行 速度 很 大 程度 上 依赖 于 指令 和 数 
据 在 处 理 器 与 存储 器 之 间 传 输 的 速度 。 此 外 、 大 容量 的 内 存 对 于 加 快 处 理 大 量 数据 的 程序 执行 
速度 也 是 十 分 重要 的 。 

从 理想 的 角度 考虑 ， 存 储 器 应 该 是 高 速度 、 大 容量 、 而 且 很 廉价 的 ， 但 不 幸 的 是 不 可 能 同 
时 满足 这 三 个 要 求 ， 在 增加 速度 和 容量 的 同时 会 导致 成 本 的 增加 。 为 了 解决 这 个 问题 ， 人 们 做 
了 很 多 工作 去 开发 一 些 巧 妙 的 结构 ， 这 些 结构 能 在 合理 的 成 本 范围 内 ， 提 高 存储 器 的 表现 速度 
和 表现 容量 。 

首先 ， 我 们 将 描述 在 在 储 器 实现 中 最 常用 的 组 件 和 组 织 结构 。 然 后 来 分 析 存 储 器 的 速度 ， 
并 且 论述 如 何 通过 使 用 高 速 缓存 的 方法 来 提高 存储 器 的 表现 速度 。 接 着 介绍 用 于 增加 存储 器 表 
现 容量 的 虚拟 存储 器 概念 。 最 后 将 讨论 能 提供 更 大 存储 能 力 的 辅助 存储 设备 。 


5.1 基本 概念 


任何 一 台 计算 机 中 能 使 用 的 存储 器 最 大 容量 取决 于 寻 址 方式 ， 例 如 16 位 机 能 产生 16 位 地 址 ， 
它 能 在 2% = 64K 个 存储 器 单元 中 寻 址 。 类 似 地 ， 指 令 能 产生 32 位 地 址 的 机 器 能 使 用 包含 22 = 4G 
个 单元 的 存储 器 ， 而 40 位 地 址 的 机 器 能 访问 24 = 1T 的 单元 。 单 元 的 数目 表示 计算 机 地 址 空间 的 
大 小 。 

大 多 数 现代 计算 机 是 按 字 节 编 址 的 ， 图 2-7 显 示 了 32 位 按 字 节 可 编 址 计算 机 可 能 的 地 址 分 配 
方案 。Big-endian 方 案 用 在 68000 处 理 器 中 ，little-endian 方 案 用 在 Intel 处 理 器 中 。 ARM 体 系 结构 
能 够 进行 配置 ， 可 以 使 用 以 上 任何 一 种 方案 。 当 考虑 到 存储 器 结构 时 ， 这 两 种 方案 之 间 并 没有 
本 质 的 区 别 。 
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存储 器 通常 被 设计 成 按 字 存 储 和 检索 数据 ， 实 际 上 ， 一 次 存储 器 访问 存储 和 检索 的 位 数 等 
于 计算 机 中 字 长 的 最 常用 定义 。 例 如 ， 考 虑 一 台 指 令 能 产生 32 位 地 址 的 按 字 节 可 编 址 的 计算 机 ， 
当 处 理 器 给 存储 器 发 送 一 个 32 位 地 址 时 ， 其 中 高 30 位 的 地 址 决定 哪 一 个 字 被 访问 。 如 果 只 是 访 
问 一 个 字 节 ， 那 么 最 低 的 两 位 地 址 指定 哪 一 个 字 节 被 访问 。 在 字 节 读 取 操 作 中 ， 其 他 字 节 可 能 
也 被 从 存储 器 中 取出 ， 但 是 它们 会 被 处 理 器 忽略 ， 而 在 字 节 写 人 操作 中 ,存储 器 控制 电路 必须 
保证 字 中 其 他 字 节 的 内 容 不 被 修改 。 

现代 计算 机 存储 器 的 实现 非常 复杂 ， 刚 接触 时 很 难 理解 。 为 了 简化 对 存储 器 结构 的 介绍 ， 
我 们 首先 来 看 一 下 传统 的 体系 结构 ， 在 后 面 的 部 分 中 再 讨论 最 新 的 技术 方法 。 

从 系统 的 角度 ， 我 们 可 以 把 存储 器 部 件 看 作 是 一 个 黑 盒子 ， 它 通过 使 用 两 个 寄存 器 ， 数 据 
可 以 在 处 理 器 和 存储 器 之 间 传 给 ， 这 两 个 寄存 器 通常 称 为 MAR (存储 器 地 址 寄存 器 ) 和 MDR 
(存储 器 数据 寄存 器 )， 它 们 在 1.2 节 中 已 介绍 过 。 如 果 MAR 的 长 度 是 位 ，MDR 的 长 度 是 n 位 ， 那 
么 存储 器 部 件 能 够 包含 2 个 可 编 址 单元 。 在 一 个 存储 周期 中 ，n 位 数据 在 存储 器 和 处 理 器 中 间 传 
输 。 这 个 传输 在 处 理 器 总 线 上 进行 ， 总 线 包括 k 条 地 址 线 和 n 条 数据 线 。 总 线 还 包括 Read / Write 
(R/W) 控制 线 和 存储 器 功能 完成 (MFC) 控制 线 ， 用 于 协调 数据 传输 。 其 他 控制 线 也 可 以 被 添 
加 进来 ， 用 来 指示 有 多 少 个 字 节 被 传输 。 图 5-1 中 示意 性 地 给 出 了 处 理 器 和 存储 器 之 间 的 连接 。 


最 多 2 个 可 编 址 
单元 


字 长 =n 位 


控制 线 
( R/ W,MFC, 等 ) 





图 5-1 存储 器 到 处 理 器 的 连接 


处 理 器 从 存储 器 读 取 数据 时 ， 把 需要 读 取 的 存储 单元 的 地 址 装 进 MAR 寄 存 器 ， 并 把 R/ W£ 
设 成 1。 存 储 器 作出 响应 ， 把 指定 位 置 的 数据 放 到 数据 线 上 ， 并 发 送 MFC 信 号 确认 这 个 操作 。 当 
收 到 MFC 信 号 上 时， 处 理 器 就 把 数据 线 上 的 数据 装 和 MDR 寄存 器 。 

处 理 器 写 入 数据 时 ， 把 要 写 入 的 存储 单元 地 址 装 入 MAR， 并 把 数据 装 和 MDR 中， 再 把 
R/ 区 线 设 成 0， 表 示 这 是 一 个 写 操作 。 

如 果 读 写 操作 要 访问 主 存 中 一 个 连续 的 存储 单元 地 址 时 ， 可 以 采用 块 传输 ， 块 传输 时 只 需 
把 块 的 第 一 个 单元 的 地 址 发 送 到 存储 器 中 。 在 5.5 节 中 我 们 将 会 遇 到 需要 块 传输 的 情况 。 

存储 器 访问 可 以 使 用 时 钟 来 同步 ， 也 可 以 使 用 控制 总 线 传输 的 特殊 信号 来 控制 ， 使 用 在 
4.5.1 节 中 描述 的 总 线 信号 方案 。 将 存储 器 的 读 操作 和 写 操作 分 别 看 作 输入 总 线 传输 和 输出 总 线 
传输 来 控制 。 

对 存储 器 速度 的 一 个 有 用 衡量 标准 是 一 个 操作 从 开始 到 结束 所 用 的 时 间 ， 例 如 读 信号 和 
MEC 信 号 之 间 的 时 间 ， 这 被 称 为 存储 器 访问 时 间 。 另 一 个 重要 的 衡量 标准 是 存储 器 周期 时 间 ， 
它 是 指 相继 两 个 存储 器 操作 开始 时 刻 之 间 的 最 小 时 间 延 迟 ， 例 如 相继 两 个 读 操作 之 间 的 时 间 。 
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一 般 来 说 ， 周 期 时 间 比 访问 时 间 稍 长 ， 这 与 存储 器 的 实现 细节 有 关 。 | 

如 果 对 于 一 个 存储 器 中 任何 一 个 存储 单元 的 读 写 访问 都 能 在 固定 的 时 间 段 内 完成 ， 而 且 这 
个 时 间 段 与 存储 单元 的 地 址 无 关 ， 那 么 这 个 存储 器 就 称 为 随机 访问 存储 器 (RAM)。 这 个 定义 
把 随机 存储 器 与 连续 存储 设备 或 部 分 连续 存储 设备 区 分 开 来 ， 例 如 磁盘 和 磁带 ， 后 者 的 访问 时 
间 依 赖 于 数据 的 位 置 或 地 址 。 

实现 存储 器 的 基本 技术 是 使 用 半导体 集成 电路 ， 后 面 的 章节 将 介绍 关于 随机 存储 器 的 内 部 
结构 和 操作 的 基本 情况 ， 然 后 我 们 再 讨论 增加 存储 器 有 效 速度 和 容量 的 技术 。 

计算 机 处 理 器 处 理 指令 和 数据 的 速度 通常 比 从 存储 器 中 获取 指令 和 数据 的 速度 快 ， 因 此 ， 
存 储 器 周期 时 间 是 整个 系统 的 壮 开 。 减 少 周 期 时 间 的 一 个 办 法 是 使 用 高 速 颖 存 。 高 速 缓存 是 一 
个 容量 小 、 速 度 快 的 存储 器 ， 它 播 在 容量 大 、 速 度 慢 的 主 存 与 处 理 器 之 间 ， 保 存 当 前 活动 的 程 
序 段 和 数据 。 

虚拟 存储 器 是 关于 存储 器 结构 的 另 一 个 重要 概念 。 到 现在 为 止 ， 我 们 都 是 假定 处 理 器 产生 
的 地 址 直接 指明 物理 存储 器 的 存储 位 置 ， 但 并 不 是 所 有 情况 都 是 这 样 的 。 数 据 在 物理 存储 器 中 
的 存储 地 址 可 能 与 程序 指定 的 地 址 并 不 一 样 ， 具 体 原因 将 在 后 面 章 节 中 给 出 。 存 储 器 控制 电路 
把 程序 指定 的 地 址 转换 成 能 用 于 访问 物理 存储 器 的 地 址 ， 在 这 种 情况 下 ， 处 理 器 产生 的 地 址 称 
为 虚拟 地 址 或 逻辑 地 址 。 虚 拟 地 址 空间 映射 到 数据 实际 所 在 的 物理 存储 器 上 ， 映 射 功能 通过 一 
个 特殊 的 存储 器 控制 电路 来 实现 ， 这 个 电路 通常 称 为 存储 器 管理 部 件 。 映 射 功能 可 以 根据 系统 
的 要 求 在 程序 执行 时 更 改 。 

虚拟 存储 器 用 于 增加 物理 存储 器 的 表现 容量 。 数 据 在 虚拟 地 址 空间 中 编 址 ， 虚 拟 地 址 空间 
可 以 与 处 理 器 的 寻 址 能 力 一 样 大 。 但 是 在 任何 一 个 给 定时 刻 ， 只 有 虚拟 地 址 空间 的 活动 部 分 被 
映射 到 物理 存储 器 中 ， 而 其 他 部 分 被 映射 到 使 用 的 大 容量 存储 设备 ， 通 常 是 磁盘 中 。 在 程序 执 
行 期 间 当 虚拟 地 址 空间 的 活动 部 分 发 生 改变 时 ， 存 储 器 管理 部 件 更 改 映 射 功能 ， 并 在 磁盘 和 存 
储 器 之 间 传 输 数 据 。 这 样 ， 在 每 一 个 存储 器 周期 ， 地 址 处 理 机 制 判 断 在 给 定 地 址 中 的 信息 是 否 
在 物理 存储 器 中 。 如 果 在 ， 则 相应 的 字 被 访问 ， 然 后 继续 执行 ， 否 则 ， 从 磁盘 上 将 包含 要 访问 
字 的 页 传递 到 物理 存储 器 中 ， 换 页 过 程 在 5.7.1 节 中 解释 。 这 个 页 替换 当前 存储 器 中 某 个 非 活动 
页 。 因 为 在 磁盘 和 存储 器 之 间 移动 页 需要 花费 时 间 ， 所 以 频繁 的 页 移动 会 导致 访问 速度 的 降低 。 
但 是 ， 通 过 合理 地 选择 哪 一 个 页 被 换 出 存储 器 ， 可 以 在 相当 长 的 一 段 时 间 内 使 得 处 理 器 要 访问 
的 字 以 很 高 的 概率 保存 在 物理 存储 器 中 。 

这 一 节 已 经 简单 地 介绍 了 存储 器 系统 的 一 些 组 织 结构 特征 ， 这 些 特征 已 经 被 开发 出 来 ， 并 
用 来 在 计算 机 系统 总 体 成 本 允许 的 范围 内 提供 尽 可 能 大 和 尽 可 能 快 的 存储 器 。 现 在 不 要 求 读者 
了 解 全 部 的 概念 和 含义 ， 后 面部 分 将 给 出 更 多 的 细节 。 我 们 把 这 些 术语 放 在 一 起 介绍 ， 使 大 家 
理解 它们 是 相互 联系 的 ， 了 解 它们 之 间 的 关系 与 对 单个 特征 细节 的 学 习 一 样 重要 。 


5.2 半导体 随机 存储 器 


半导体 存储 器 可 以 在 很 广泛 的 速度 范围 内 使 用 ， 它 们 的 周期 时 间 可 以 从 100ns 到 小 于 10ns。 
半导体 存储 器 在 20 世 纪 60 年 代 刚刚 出 现时 ， 比 它们 所 替换 的 磁 芯 存储 器 要 昂贵 得 多 。 由 于 VLSI 
《超大 规模 集成 电路 ) 的 快速 发 展 ， 半 导体 存储 器 的 成 本 显著 地 下 降 。 因 此 ， 目 前 在 实现 内 存 时 ， 
只 使 用 半导体 存储 器 。 在 这 一 节 ， 我 们 将 讨论 半导体 存储 器 的 主要 特性 。 首 先 介绍 在 芯片 内 存 
储 器 单元 的 组 织 方 法 。 
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5.2.1 存储 器 芯片 的 内 部 组 织 结构 


存储 器 单元 通常 按 阵列 的 形式 构成 ， 其 中 每 个 单元 存储 一 位 (bit) 信息 。 图 5-2 描 述 了 一 种 
可 能 的 组 织 方式 。 每 一 个 单元 行 组 成 存储 器 中 一 个 字 ， 所 有 的 单元 行 通过 一 条 公共 的 线 连接 到 
一 起 ， 这 条 线 称 为 字 线 ， 它 是 由 芯片 的 地 址 译 码 器 驱动 的 。 每 列 的 单元 通过 两 条 位 线 连 接 到 一 
个 读 出 / 写 电 路 上 ， 读 出 / 写 电路 连接 到 芯片 的 数据 输入 /输出 线 上。 在读 操作 期 间 ， 这 些 电 路 读 
取 通 过 字 线 选择 的 单元 所 存储 的 信息 ， 并 把 这 些 信息 传输 到 输出 数据 线 上 。 在 写 操作 期 间 ， 读 
出 / 写 电路 接收 输入 信息 ， 并 把 它们 存储 到 选 定 的 字 对 应 的 单元 中 。 

图 5-2 是 一 个 非常 小 的 存储 器 芯片 例子 ， 它 包含 16 个 字 ， 每 个 字 包 括 8 位 ， 这 称 为 16 x 8 的 结 
构 。 每 一 个 读 出 / 写 电 路 的 数据 输入 输出 连接 到 一 条 双向 数据 线 上 ， 这 个 数据 线 可 以 连接 到 计算 
机 的 数据 总 线 上 。 除 了 地 址 线 和 数据 线 以 外 ， 还 有 两 条 控制 线 ， 它 们 分 别 是 R/ 友和 CS。R/ Wi 
入 指定 请 求 的 操作 ， 而 CS (芯片 选择 ) 输入 在 多 芯片 存储 器 系统 中 选择 一 个 给 定 的 芯片 ， 这 些 
将 在 5.2.4 节 中 讨论 。 










读 出 / 写 电路 读 出 / 写 电路 


数据 输入 /输出 线 : b b, bo 
图 5-2 存储 器 芯片 内 部 位 单元 的 组 织 结构 


图 5-2 中 的 存储 器 电路 存储 了 128 位 ， 需 要 为 地 址 、 数 据 和 控制 提供 14 条 引线 。 当 然 ， 它 还 
需要 两 条 线 用 于 电源 支持 和 接地 。 现 在 来 考虑 一 个 稍微 大 一 些 的 存储 器 电路 ， 它 包含 1K (1024) 
个 存储 单元 。 这 个 电路 可 以 被 组 织 成 128 x 8 的 存储 器 ， 总 共 需 要 19 根 引线 。 换 一 种 方式 ， 我 们 
可 以 把 这 个 电路 组 织 成 1K x 1 的 形式 。 在 这 种 情况 下 ， 需 要 10 位 地 址 ， 但 只 需要 一 根 数据 线 ， 因 
此 共 需 要 15 根 引线 。 图 5-3 显 示 了 这 种 组 织 结构 。 需 要 的 10 位 地 址 被 分 成 两 组 ， 每 组 5 位 ， 分 别 
构成 单元 阵列 的 行 地 址 和 列 地 址 。 行 地 址 选择 一 个 行 ， 包 含 32 个 存储 单元 ， 它 们 被 并 行 访问 。 
但 是 ， 根 据 列 地 址 ， 这 些 单元 中 只 有 一 个 通过 输入 输出 多 路 复 用 器 连接 到 外 部 数据 线 上 。 

商业 上 可 用 的 存储 器 芯片 所 包含 的 存储 单元 数 比 图 5-2 和 图 5-3 显 示 的 例子 要 多 得 多 ， jiin 
用 小 的 例子 可 以 更 容易 理解 。 大 规模 芯片 的 组 织 结 构 从 本 质 上 来 说 与 图 $-3 所 示 的 一 样 ， 只 
使 用 更 大 的 存储 器 单元 阵列 ， 并 且 有 更 多 的 引线 。 例 如 ， 一 个 的 志 片 的 组 织 结 向 可 能 是 512 
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x&， 这 时 需要 19 根 地 址 输入 /输出 引 脚 和 8 根 数据 输入 /输出 引 脚 。 现 在 容量 达 数 百 光 的 艺 片 也 已 
经 出 现 了 。 
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5 位 行 地 址 
32 x 32 存 储 器 
单元 阵列 
读 出 / 
d SER 
10 位 
地 址 _ 
32 至 1 的 输出 多 路 — R/W 
~ 一 CS 
5 位 列 地 址 I 
数据 输入 /输出 
图 5-3 1K x 1 的 存储 器 芯片 组 织 结构 
5.2.2 静态 存储 器 


有 的 电路 只 要 不 停止 供电 ， 就 能 一 直 保 持 它 的 状态 ， 由 这 样 电路 组 成 的 存储 器 称 为 静态 在 
储 器 。 图 5-4 描 述 了 如 何 实现 静态 随机 存储 
器 (SRAM) 的 存储 单元 。 两 个 反 相 器 交 又 
艳 合 形成 一 个 锁 存 器 ， 锁 存 器 通过 晶体 管 
7 和 7 连接 到 两 根 位 线 上 ， 这 些 晶 体 管 起 
到 开关 的 作用 ， 可 以 在 字 线 的 控制 下 打开 
或 关闭 。 当 字 线 在 低 电 平 ， 晶 体 管 断 开 ， 
锁 存 器 保持 它 的 状态 。 例 如 ， 我 们 假设 如 
果 X 点 的 逻辑 值 为 1 且 Y 点 的 逻辑 值 为 0 时 存 
储 单元 处 于 状态 1， 只 要 字 线 的 信号 处 于 低 
电 平 ， 这 个 状态 将 一 直 保持 下 去 。 

读 操作 

为 了 读 取 SRAM 存 储 单元 的 状态 ， 字 线 图 54 静态 随机 存储 器 单元 
被 激活 以 闭合 开关 Ti 和 7T2。 如 果 单 元 处 于 状态 1， 那 么 位 线 b 上 的 信号 是 高 电 平 ， 而 位 线 b' 上 的 
信号 是 低 电 平 。 如 果 单元 的 状态 为 0〈， 则 正好 相反 。 因 此 ，b 和 b' 是 互补 的 。 位 于 位 线 一 端的 读 
出 / 写 电路 监测 5 和 的 状态 ， 并 相应 设置 输出 。 

写 操作 

要 设置 一 个 单元 的 状态 时 把 适当 的 值 放 到 位 线 b 上 ， 并 把 它 的 补 值 放 到 5" 上， 然后 激活 字 
线 ， 这 样 就 迫使 单元 进入 相应 的 状态 .位 线 上 需要 的 信号 由 读 出 / 写 电路 产生 ， 357 
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CMOS 单 元 

实现 图 5-4 中 存储 单元 的 CMOS 单 元 在 图 5-5 中 给 出 。 晶 体 管 对 (Ts, Ts) 和 (Ta, T) 形成 锁 存 器 
中 的 反 相 器 〈( 见 附录 A)。 存 储 单元 的 状态 就 像 刚 才 解 释 的 那样 被 读 写 。 例 如 ， 位 于 状态 1 时 ， 通 
过 打开 Ts; 和 Ts 使 X 点 保持 在 高 电 平 ， 而 Ts 和 7T; 是 关闭 的 。 这 样 ， WRTA (闭合 ), 位 
线 b 和 将 分 别 具 有 高 电 平 和 低 电 平 信号 

在 老 的 CMOS 静 态 随机 存储 器 中 ， 电源 供应 电压 We 是 SV， 在 新 的 低压 版 本 中 是 3.3V。 注 
意 ， 存 储 单 元 需要 持续 的 电压 供应 来 维持 ， 
它 的 状态 ， 如 果 电 源 中 断 了 ， 单 元 中 的 内 
AMAER. 当 电 源 恢复 时 ， 单 元 进入 一 
个 稳定 状态 ， 但 这 个 状态 不 一 定 与 电源 中 
新 前 单元 的 状态 相同 。 因 为 存储 的 内 容 在 
掉 电 后 会 丢失 ， 所 以 SRAM 被 称 为 易 失 性 
ARB. 

CMOS 静 态 随 机 存储 器 的 一 个 主要 优 
点 是 它们 的 功 耗 非常 低 ， 因 为 只 有 被 访问 
时 电流 才 流 入 存储 单元 。 此 外 ，T1!，T, 和 
每 个 反 相 器 中 的 一 个 晶体 管 都 是 关闭 的 ， 
这 样 保证 在 ww 和 地 之 闻 没 有 有 效 通 路 。 . _ 

静态 随机 存储 器 的 访问 速度 非常 快 ， ESS CMOS 存 储 器 单元 的 例子 
商业 芯片 中 已 经 有 访问 时 间 达 几 纳 秒 的 芯片 。SRAM 通 常用 于 速度 为 关键 因素 的 应 用 场合 中 。 


5.2.3 异步 动态 随机 存储 器 


静态 随机 存储 器 速度 很 快 ， 但 是 它们 的 成 本 很 高 ， 因 为 存储 单元 需要 多 个 晶体 管 。 如 果 使 
用 更 简单 的 存储 单元 ， 那 么 就 可 以 实现 更 廉价 的 随机 存储 器 。 但 是 ， 这 样 的 单元 不 能 无 限期 地 
保存 它们 的 状态 ， 因 此 被 称 为 动态 随机 存储 器 (DRAM), 

信息 以 电容 中 电荷 的 形式 保存 在 动态 存储 器 单元 中 ， 这 些 电荷 只 能 保持 10 毫 秒 。 但 是 我 们 
需要 存储 器 单元 在 更 长 的 时 间 内 保存 信息 ， 因 此 必须 通过 把 电容 器 中 电荷 恢复 成 满 值 来 定期 刷 
新 存储 单元 中 的 内 容 。 

图 5-6 显 示 了 一 个 由 电容 器 C 和 晶体 管 7 组 成 的 动态 存储 器 单元 的 例子 。 为 了 在 单元 中 存储 信 
息 ， 上 晶体管 打开， 一 个 适当 的 电压 加 到 位 线 上 ， 这 使 得 一 定数 量 的 电荷 存储 到 电容 中 。 

晶体 管 关闭 后 ， 电 容 开 始 放电 ， 这 是 由 于 电容 本 身 位 线 
有 港 漏电 阻 ， 而 且 晶体 管 关 闭 后 ， 仍 会 有 微弱 的 电流 通 
过 ， 这 个 电流 只 有 几 皮 安 。 因 此 只 有 在 电容 上 的 电荷 降 
到 低 于 某 个 闹 值 之 前 ， 才 能 正确 读 出 存储 单元 中 存储 的 
信息 。 在 读 操作 期 间 ， 选 中 单元 的 晶体 管 会 打开 ， 连 接 
到 位 线 上 的 一 个 传 感 放大 器 检测 电容 上 的 电荷 是 否 高 于 
某 个 国 值 。 如 果 高 于 ， 那 么 它 把 位 线 上 的 电压 提高 成 满 
电压 以 表示 逻辑 值 1。 这 个 电压 重新 把 电容 器 的 电荷 充 
满 ， 使 它 对 应 逻辑 值 1。 如 果 传 感 放大 器 检测 到 电容 电 图 5-6 单 晶体 管 动态 存储 器 单元 
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元 信息 的 时 候 会 自动 刷新 它 的 内 容 。 选 定 行 中 所 有 的 单元 被 同时 读 取 ， 这 样 就 会 刷新 整 行 的 内 
容 。 传 感 放大 器 电路 的 实现 细节 超出 了 本 书 的 范围 。 

图 5-7 显 示 了 一 个 16M 位 的 DRAM 心 片 ， 被 配置 成 2M x 8 的 形式 。 存 储 单元 被 组 织 成 4K x 4K 
的 阵列 ， 每 行 的 4096 个 单元 被 分 成 512 组 ， 每 组 8 个 单元 ， 所 以 一 行 可 以 存储 512 字 节 的 数据 。 选 
择 一 行 需要 12 根 地 址 线 ， 在 一 个 选 定 的 行 中 指定 一 个 8 位 的 组 还 需要 9 根 地 址 线 。 因 此 ， 在 这 个 
存储 器 中 访问 一 个 字 节 需要 21 根 地 址 线 ， 高 12 位 和 低 9 位 分 别 构成 一 个 字 节 的 行 地 址 和 列 地 址 。 
为 了 减少 外 部 连接 的 引 脚 数 ， 行 地 址 和 列 地 址 多 路 复 用 12 根 引 脚 。 在 读 或 写 操作 期 间 ， 行 地 址 
首先 被 加 载 ， 芯 片 响应 在 行 地 址 选 通 (RAS) 输入 线 上 的 脉冲 信号 ， 把 行 地 址 装 入 行 地 址 锁 存 
器 中 。 然 后 读 操作 开始 ， 选 定 行 上 的 所 有 单元 被 读 取 和 刷新 。 行 地 址 被 装载 后 ， 很 快 列 地 址 被 
加 载 到 地 址 引 脚 上 ， 然 后 在 列 地 址 选 通 (CAS) 信号 的 控制 下 ， 列 地 址 被 装 入 列 地 址 锁 存 器 。 
列 地 址 锁 存 器 中 的 信息 被 译 码 ， 该 列 地 址 对 应 的 一 个 8 位 组 的 读 出 / 写 电路 被 选中 。 如 果 R/ WE 
制 信号 指示 这 是 一 个 读 操作 ， 那 么 选 定 电路 的 输出 值 被 传输 到 数据 线 D; -。 上 。 对 于 一 个 写 操作 ， 
D?-。 上 的 信息 被 传输 给 选 定 的 电路 ， 然 后 用 这 些 信息 覆盖 选 定 的 8 列 存储 单元 的 内 容 。 我 们 应 该 
注意 ， 在 商业 DRAM 芯 片 中 ，RAS 和 CAS 控 制 信号 是 低 电 平 有 效 ， 因 此 当 它 们 从 高 电 平 变 成 低 
电 平时 ， 会 导致 地 址 被 锁 存 。 为 了 表示 这 种 情况 ， 在 图 中 这 些 信号 表示 成 RAS 和 CAS. 
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图 5-7 2M x 8 的 动态 存储 器 芯片 的 内 部 组 织 结构 

不 论 是 读 操作 还 是 写 操作 ， 加 载 行 地 址 会 导致 相应 行 中 所 有 的 单元 都 被 读 取 并 刷新 。 为 了 
保证 DRAM 中 的 内 容 被 保留 ， 必 须 定期 访问 每 一 行 中 的 单元 。 刷 新 电路 自动 完成 这 个 功能 。 很 
多 动态 存储 器 芯片 都 在 芯片 内 部 自 带 一 个 刷新 装置 ， 这 时 ， 这 些 存 储 器 芯片 的 动态 属性 对 于 用 
户 来 说 几乎 是 看 不 出 来 的 。 

在 本 节 描 述 的 DRAM 中 ， 存 储 器 设备 的 时 序 是 异步 控制 的 。 一 个 特定 的 存储 控制 器 电路 提 
供 控制 信号 RAS 和 CAS， 它 负责 控制 时 序 ， 处 理 器 必须 考虑 存储 器 响应 的 延 时 ， 这 种 存储 器 称 
为 异步 动态 随机 看 储 器 (asynchronous DRAM), 

由 于 DRAM 的 高 密度 和 低 成 本 ， 它 被 广泛 应 用 于 计算 机 的 存储 器 部 件 中 。 可 用 芯片 的 容量 





i 
° 
Ne] 


214 £ 5 Ë 





从 1M 到 256M， 甚 至 会 开发 出 更 大 容量 的 芯片 。 为 了 减少 计算 机 需要 的 存储 器 世 片 的 数量 ， 
DRAM 芯 片 被 组 织 成 可 以 并 行 读 写 多 个 位 ， 如 图 $-7 所 示 。 为 了 在 设计 存储 器 系统 时 提供 更 多 的 
灵活 性 ， 这 些 芯 片 以 多 种 组 织 形式 生产 。 例 如 ， 一 个 64M 位 的 芯片 可 以 组 织 成 16M x 4、8M x 8 
或 4M x 16 的 形式 。 

快速 页 模式 

当 图 5-7 所 示 的 DRAM 被 访问 时 ， 选 中 行 的 4096 个 单元 的 内 容 都 被 读 取 ， 但 是 只 有 8 位 信息 
被 放 在 数据 线 D1-。 上 ， 这 个 字 节 通过 列 地 址 位 As-o 来 选择 。 可 以 做 一 个 简单 的 改进 ， 使 得 在 访 
问 同一 行 中 共 他 字 节 的 时 候 不 需要 重新 进行 行 选择 。 在 每 行 传 感 放大 器 的 输出 端 加 上 一 个 锁 存 
器 ， 加 载 行 地 址 的 时 候 ， 会 把 选 定 行 中 的 每 个 位 装 入 相应 的 锁 存 器 中 。 于 是 ， 只 要 加 载 不 同 的 
列 地 址 就 能 把 其 他 的 字 节 放 到 数据 线 上 。 

最 有 用 的 方式 是 按 顺 序 传输 字 节 ， 这 需要 在 连续 的 CAS 信 号 控制 下 加 载 连续 的 列 地 址 序列 。 
这 种 方案 在 传输 一 块 数据 的 时 候 要 比 使 用 随机 地 址 传送 的 速率 快 得 多 。 这 种 块 传输 能 力 称 为 快 
圳 页 模式 。( 通 常 行业 用 语 中 把 少量 字 节 称 为 块 ， 而 把 大 批 字 节 称 为 页 。) 

按 规则 模式 访问 内 存 的 应 用 程序 可 以 利用 在 块 传输 时 获得 的 高 速率 特性 ， 例 如 图 形 终端 。 
这 个 特征 在 通用 计算 机 的 主 存 和 高 速 缓 存 之 间 的 数据 块 传送 时 也 非常 有 用 ， 我 们 将 在 5.5 节 中 解 
释 这 一 点 。 


5.2.4 同步 动态 随机 存储 器 


随 着 近来 存储 器 技术 的 发 展 ， 出 现 了 操作 直接 与 时 钟 信号 同步 的 动态 随机 存储 器 ， 这 种 存储 
器 称 为 同步 动态 随机 存储 器 (SDRAM)。 图 5-8 显 示 了 SDRAM 的 结构 。 它 的 单元 阵列 与 异步 动态 
随机 存储 器 一 样 ， 地 址 和 数据 连接 通过 寄存 器 进行 缓冲 。 我 们 应 该 特别 注意 在 每 个 传 感 放大 器 的 
输出 端 连 有 一 个 锁 存 器 ， 读 操作 使 得 选中 行 中 所 有 单元 的 内 容 被 装 人 锁 存 器 。 但 是 ， 如 果 只 是 为 
了 刷新 而 访问 ， 那 么 锁 存 器 中 的 内 容 不 会 改变 ， 它 只 会 刷新 存储 单元 中 的 内 容 。 保 存在 选中 列 对 
应 锁 存 器 中 的 数据 被 传输 到 数据 输出 寄存 器 中 ， 然 后 就 可 以 在 数据 输出 引 脚 上 获得 这 些 数据 。 

SDRAM 有 几 种 不 同 的 操作 模式 ， 可 以 通过 向 模式 寄存 器 中 写 入 控制 信息 来 选择 这 些 模式 ， 
例如 可 以 指定 不 同 长 度 的 脉冲 串 操 作 。 使 用 块 传输 能 力 的 脉冲 串 操 作 ， 就 是 上 面 描述 的 快速 页 
模式 特征 。 在 SDRAM 中 ， 不 需要 在 CAS 线 上 提供 外 部 产生 的 脉冲 去 选择 连续 的 列 ， 芯 片 内 部 使 
用 列 计数 器 和 时 钟 信号 来 提供 需要 的 控制 信号 。 新 数据 在 每 个 时 钟 周期 内 被 放 到 数据 线 上 ， 所 
有 的 操作 由 时 钟 信号 的 上 升 沿 触发 。 

图 5-9 是 一 个 典型 的 长 度 为 4 的 读 脉 冲 串 时 序 图 。 首 先 ， 行 地 址 在 RAS 信 号 的 控制 下 被 锁 存 。 
存储 器 通常 使 用 2 到 3 个 时 钟 周期 (在 图 中 我 们 使 用 两 个 ) 激活 选中 的 行 。 然 后 ， 列 地 址 在 CAS 
信号 的 控制 下 被 锁 存 。 一 个 时 钟 周期 后 ， 第 一 组 数据 被 放 到 数据 线 上 。 然 后 SDRAM 自 动 增加 列 
地 址 去 访问 选 定 行 中 后 面 的 三 组 数据 ， 在 随后 的 三 个 时 钟 周期 内 把 这 三 组 数据 放 到 数据 线 上 。 

SDRAM 有 内 置 的 柚 新 电路 ， 其 中 一 个 部 分 是 刷新 计数 器 ， 提 供 要 刷新 的 行 地 址 。 在 一 个 典 
型 的 SPDRAM 中 ， 每 一 行 至 少 要 每 64ms 刷 新 一 次 。 

商业 SDRAM 能 够 在 超过 100MHz 的 时 钟 频率 下 使 用 ， 这 些 芯片 是 为 满足 大 量 使 用 的 商用 处 
理 器 的 需求 而 设计 的 。 例如，Intel 制 定 了 PC100 和 PC133 总 线 标准 ， 分 别 规定 系统 总 线 ( 主 存 与 


之 连接 ) 受 100MHz 和 133MHz 的 时 钟 控制 ， 因 此 各 主要 存储 器 芯片 生产 厂商 都 生产 100MHz 和 
133MHz 的 SDRAM 芯 片 。 
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(o XPE ALAD) 
图 5-9 在 SDRAM 中 长 度 为 4 的 读 脉 冲 串 


存储 器 和 处 理 器 之 间 的 传输 包括 传输 单个 字 或 传输 一 小 块 字 ( 传 输送 至 或 来 自 于 处 理 器 高 
速 缓存 ， 高 速 缓存 在 5.5 节 讨论 )。 大 的 块 由 一 页 数据 组 成 ， 它 在 存储 器 与 磁盘 之 间 传 输 ， 这 在 第 
5.7 节 中 描述 。 这 些 传输 的 速度 和 效率 对 计算 机 系统 的 性 能 影响 很 大 ， 一 个 合理 的 性 能 指标 由 两 
个 参数 给 出 : 延迟 和 带宽 。 

存储 器 延迟 是 指向 或 从 存储 器 传输 一 个 字 的 数据 需要 花费 的 时 间 。 当 读 写 单个 字 的 数据 时 ， 
延迟 完全 可 以 用 来 标志 存储 器 的 性 能 ， 但 是 对 于 传输 一 块 数据 的 脉冲 串 操作 ， 完 成 操作 的 时 间 
还 依赖 于 后 继 字 节 的 传输 速度 以 及 块 的 大 小 。 在 块 传输 中 ， 延 迟 用 来 表示 传输 数据 的 第 一 个 字 
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所 化 费 的 时 间 ， 这 个 时 间 通 常 比 传输 块 中 后 继 的 字 所 花费 的 时 间 长 得 多 。 例 如 ， 在 图 $-9 所 示 的 
时 序 图 中 ， 当 RAS 信 号 出 现时 ， 访 问 周期 开始 ， 第 一 个 字 在 五 个 时 钟 周 期 后 传输 ， 因 此 延迟 是 
五 个 时 钟 周期 。 如 果 时 钟 频率 是 100MHz， 那 么 延迟 是 30ns。 剩 下 的 三 个 字 在 后 续 的 时 钟 周 期 中 
传输 。 

当 传 输 数 据 块 时 ， 知 道 需要 多 长 时 间 完 成 整个 块 的 传输 是 很 重要 的 。 因 为 块 的 大 小 各 不 相 
同 ， 所 以 根据 在 一 秒 钟 之 内 能 传输 的 位 或 字 节 的 数量 来 定义 性 能 度量 标准 是 很 有 用 的 ， 这 个 标 
准 通常 称 为 存储 器 带宽 。 存 储 器 部 件 (由 一 个 或 多 个 存 鱼 器 芯片 构成 ) 的 带宽 依赖 于 访问 存储 
数据 的 速度 和 能 并 行 访问 的 位 数 。 但 是 ， 计 算 机 系统 (包括 存储 器 和 处 理 器 之 间 的 数据 传输 ) 
的 有 效 带 宽 不 仅仅 由 存储 器 的 速度 决定 ， 它 还 与 连接 的 存储 器 及 与 处 理 器 连 线 的 传输 能 力 有 关 ， 
一 般 就 是 指 总 线 速度 。 存 储 器 芯片 通常 按 通 用 总 线 的 速度 需求 设计 。 显 然 ， 带 宽 与 访问 速度 、 
沿 单线 的 传输 速度 及 并 行 访问 位 数 ， 也 就 是 连 线 的 数目 有 关 ， 因 此 ， 带 宽 等 于 数据 传输 (访问 ) 
速率 与 数据 总 线 宽度 的 乘积 。 

双 信 数据 速率 SDRAM 

通过 对 提高 性 能 的 不 断 探 索 ，SDRAM 的 更 快 版 本 被 开发 出 来 。 标 准 SDRAM 在 时 钟 信号 的 
上 升 沿 执行 所 有 的 动作 ， 而 现在 有 一 种 类 似 的 存储 器 设备 出 现 了 ， 它 以 同样 的 方式 访问 存储 器 
单元 阵列 ,但 是 它 在 时 钟 信号 的 上 升 沿 和 下 降 沿 都 传输 数据 。 这 种 设备 的 延迟 与 标准 SDRAM 一 
样 ， 但 是 由 于 在 时 钟 信 号 的 两 个 边沿 传输 数据 ， 因 此 在 脉冲 串 传输 时 ， 它 们 的 实际 囊 寅 是 原来 
的 两 倍 。 这 种 设备 就 是 双 倍 数据 速率 SDRAM (double-data-rate SDRAM, DDR SDRAM). 

为 了 能 以 足够 高 的 速率 访问 数据 ， 存 储 器 单元 阵列 被 组 织 成 两 个 存储 体 ， 每 个 存储 体 都 能 
单独 访问 。 一 个 给 定 块 中 连续 的 字 被 存储 到 不 同 的 存储 体 中 ， 这 种 字 的 交 又 可 以 实现 同时 访问 
在 一 个 时 钟 信号 的 连续 边沿 上 传输 的 两 个 字 。 我 们 将 在 5.6.1 节 更 详细 地 考虑 交叉 的 概念 。 

DDR SDRAM 和 标准 SDRAM 在 经 常 使 用 块 传输 的 应 用 中 很 有 效 ， 在 主 存 主要 向 或 从 处 理 器 
高 速 缓存 传输 数据 的 通用 计算 机 中 也 是 这 样 ， 参 看 5.5 节 。 在 高 质量 视频 播放 时 也 需要 块 传输 。 


5.2.5 大 容量 存储 器 的 结构 


我 们 已 经 讨论 了 存储 器 电路 的 基本 组 织 结 构 ， 它 们 可 以 在 一 个 单独 的 芯片 上 实现 ， 下 面 来 
分 析 存 储 器 芯片 如 何 连接 到 一 起 形成 更 大 的 存储 器 。 

静态 存储 器 系统 

考虑 一 个 由 2M (2 097 152) 个 32 位 字 组 成 的 存储 器 ， 图 5-10 显 示 了 如 何 使 用 512K x 8 的 静 
态 存储 器 芯片 来 实现 这 个 存储 器 。 图 中 每 一 列 包括 4 个 芯片 ， 实 现 了 一 个 字 节 的 位 置 ， 四 列 合 起 
来 提供 了 需要 的 2M x 32 的 存储 器 。 每 一 个 芯片 有 一 个 控制 输入 ， 称 为 芯片 选择 (Chip Select), 
当 这 个 输入 被 设 成 1 时 ， 人 允许 芯片 从 数据 线 上 接收 数据 或 把 数据 放 到 数据 线 上 。 每 个 芯片 的 数据 
输出 都 是 三 态 的 〈 参 见 A.5.4 节 )， 只 有 选中 的 芯片 能 把 数据 放 到 数据 输出 线 上 ， 所 有 其 他 芯片 的 
输出 处 于 高 阻抗 状态 。 地 址 的 高 2 位 被 译 码 ， 用 来 决定 4 个 芯片 选择 控制 信号 中 哪 一 个 被 激活 ， 
其 余 的 19 个 地 址 位 用 来 在 选中 行 的 每 个 芯片 内 指定 哪个 字 节 位 置 被 访问 。 所 有 芯片 的 R/ WAA 
连 到 一 起 ， 提 供 一 个 通用 的 R/ 到 控制 (没有 在 图 中 显示 )。 

动态 存储 器 系统 

大 规模 动态 存储 器 系统 的 组 织 结构 本 质 上 与 图 5-10 中 的 存储 器 一 样 ， 但 是 物理 实现 通常 更 
方便 ， 它 使 用 存储 器 模块 的 形式 。 
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图 5-10 使 用 512K x 8 静态 存储 器 芯片 的 2M x 32 存 储 器 模块 的 组 织 结构 
现代 计算 机 使 用 非常 大 的 存储 器 ， 即 使 是 小 型 个 人 计算 机 也 可 能 最 少 有 32M 内 存 ， 典 型 的 
工作 站 至 少 有 128M 内 存 。 大 容量 的 内 存 会 带 来 更 好 的 性 能 ， 因 为 更 多 当前 处 理 的 程序 和 数据 能 
被 保存 在 内 存 中 ， 这 样 能 降低 访问 辅助 存储 设备 的 频率 。 但 是 ， 如 果 通过 把 DRAM 芯 片 直接 放 [505 
到 含有 处 理 器 的 主 系统 印刷 电路 板 ， 也 就 是 主板 上 的 方法 来 建立 大 容量 内 存 的 话 ， 它 将 占用 板 
上 很 大 的 空间 ， 这 是 无 法 接受 的 。 而 且 这 样 很 难 支 持 将 来 内 存 的 扩展 ， 因 为 必须 要 为 预计 的 最 
大 容量 分 配 空间 和 布线 。 这 些 因 素 导 致 了 更 大 的 存储 器 部 件 的 发 展 ， 这 就 是 所 谓 的 SIMM (单列 
直 插 存储 器 模块 ，Single In-line Memory Module) 和 DIMM ( 双 列 直 插 存 储 器 模块 ，Dual In-line 
Memory Module )。 这 种 模块 把 一 些 存 储 器 芯片 组 装 到 一 个 独立 的 小 板子 上 ， 然 后 把 它 垂直 插 人 
主板 上 一 个 单独 的 槽 中 。 不 同 容量 的 SIMM 和 DIMM 被 设计 成 使 用 相同 大 小 的 槽 ， 例 如 4M x 32 
位 、16M x 32 位 和 32M x 32 位 的 DIMM 都 使 用 100 针 的 槽 。 类 似 地 ，8M x 64 位 、 16M x 64 位 、 
32M x 64 位 和 64M x 72 位 的 DIMM 使 用 168 针 的 楷 。 这 种 模块 只 占用 主板 上 很 小 的 一 块 空 间 ， 并 
且 很 容易 通过 把 原 模 块 替换 成 使 用 相同 的 槽 但 容量 更 大 的 模块 来 实现 扩展 。 


5.2.6 存储 器 系统 因素 
为 给 定 的 应 用 选择 随机 存储 器 芯片 要 考虑 多 个 因素 ， 其 中 最 重要 的 是 成 本 、 速 度 、 功 耗 和 


i 
=i 
e 





MM í ZE 


芯片 容量 。 

静态 随机 存储 器 芯片 一 般 只 用 于 高 速 操作 的 场合 ， 它 们 的 成 本 和 容量 受 实现 基本 单元 电路 
的 复杂 程度 的 影响 。 静 态 随机 存储 器 大 部 分 用 于 高 速 缓存 。 动 态 随机 存储 器 是 实现 计算 机 主 存 
的 主要 选择 ， 这 些 世 片 可 以 达到 很 高 的 密度 ， 使 经 济 地 实现 大 容量 存储 器 变 得 切实 可 行 。 

存储 器 控制 器 

为 了 减少 引 脚 的 数量 ， 动 态 随机 存储 器 使 用 了 多 路 复 用 的 地 址 输入 。 地 址 被 分 成 两 个 部 分 ， 
高 地 址 位 用 来 选择 存储 单元 阵列 的 行 ， 它 们 首先 被 提供 ， 并 在 RAS 信 号 的 控制 下 锁 存 在 存储 器 
芯片 中 。 低 地 址 位 用 来 选择 列 ， 它 们 随后 通过 相同 的 引 脚 提供 ， 并 使 用 CAS 信 号 锁 存 。 

典型 的 处 理 器 同时 发 出 所 有 的 地 址 位 ， 使 用 到 的 地 址 多 路 复 用 功能 通常 由 存储 器 控制 器 电 
路 完成 ， 如 图 $-11 所 示 ， 它 位 于 处 理 器 和 动态 随机 存储 器 之 间 。 控 制 器 在 请 求 信号 的 控制 下 从 
处 理 器 接收 全 部 的 地 址 和 R/ 到 信号 ， 请 求 信号 表示 需要 一 个 存储 器 访问 操作 。 然 后 控制 器 把 行 
地 址 和 列 地 址 传 给 存储 器 ， 并 产生 RAS 和 CAS 信号。 这 样 ， 控 制 器 除了 能 完成 多 路 复 用 的 功能 
外 ， 还 能 提供 RAS-CAS 时 序 。 此 外 它 还 把 R/ W 和 CS 信号 送 给 存储 器 。CS 信 号 一 般 是 低 电 平 有 
效 ， 因 此 在 图 5-11 中 它 被 表示 成 C$。 处理 器 和 存储 器 之 间 的 数据 线 是 直接 连接 的 。 需 要 注意 的 
是 SDRAM 芯 片 需要 时 钟 信号 。 


行 / 列 地 址 





图 5-11 存储 器 控制 器 的 使 用 


当 使 用 没有 自 刷新 功能 的 DRAM 芯 片 时 ， 存 储 器 控制 器 必须 提供 控制 刷新 过 程 的 所 有 信息 。 
这 包括 一 个 刷新 计数 器 ， 用 来 提供 下 一 行 的 地 址 。 它 的 功能 是 在 特定 设备 指定 的 周期 内 使 所 有 - 
行 都 被 刷新 。 

刷新 开销 

所 有 的 动态 存储 器 都 必须 被 刷新 。 在 原来 的 DRAM 中 ， 刷 新 所 有 行 的 典型 周期 是 16ms， 而 
在 一 般 的 SDRAM 中 ， 周 期 是 64ms。 

考虑 一 个 存储 单元 排列 成 8K ( = 8192 ) 行 的 SDRAM， 假 设 访问 一 行 需要 4 个 时 钟 周期 ， 那 么 
它 刷新 所 有 行 需要 8192 x 4= 32 768 个 时 钟 周期 。 在 133MHz 的 时 钟 频率 下 ， 刷 新 所 有 行 需要 的 时 
间 是 32 768 / (133 x 10°)=246 x 10-“ 秒 。 于 是 刷新 过 程 在 每 64ms 间 隔 内 占用 0.246 毫 秒 ， 因 此 刷新 
开销 是 0.246164= 0.0038， 它 小 于 访问 存储 器 可 用 总 时 间 的 0.4%。 


5.2.7 Rambus 存 储 器 


动态 随机 存储 器 的 性 能 由 它 的 延迟 和 带宽 来 表示 。 由 于 所 有 的 动态 随机 存储 器 芯片 使 用 类 
似 的 存储 单元 阵列 组 织 结构 ， 如 果 它 们 使 用 相同 的 生产 过 程 产生 ， 那 么 延迟 将 趋 于 一 致 。 另 一 





方面 ， 存 储 器 系统 的 有 效 带 宽 不 仅仅 依赖 于 存储 器 芯片 的 结构 ， 还 依赖 于 连接 到 处 理 器 的 连 线 
性 质 。DDR SDRAM 和 标准 SDRAM 都 是 连接 到 处 理 器 总 线 上 ， 因 此 传输 速度 不 只 是 看 存储 器 设 
备 的 速度 ， 还 要 看 总 线 的 速度 。 时 钟 频率 为 133MHz 的 总 线 最 快 每 7.5ns 传 输 一 次 ， 如 果 时 钟 信号 
的 两 个 边沿 都 使 用 的 话 ， 则 传输 两 次 。 在 有 速度 限制 的 总 线 上 增加 传输 数据 能 力 的 惟一 办 法 就 
是 增加 数据 线 ， 但 是 这 样 会 导致 总 线 变 宽 。 

过 宽 的 总 线 成 本 很 高 ， 并 且 需 要 占用 主板 上 很 大 的 空间 。 另 一 个 可 用 的 办 法 是 实现 一 个 较 
窗 的 但 是 速度 很 快 的 总 线 。Rambus 公 司 采 用 了 这 种 办 法 ， 他 们 开发 了 一 种 自己 的 设计 方案 ， 称 
为 Rambus。Rambus 技 术 的 关键 是 在 芯片 之 闻 传 输 信息 时 使 用 了 一 种 快速 发 送信 号 的 方法 。 它 没 
有 采用 使 用 电压 0 和 Vp 表示 逻辑 值 的 信号 , 它 的 信号 由 与 参考 电压 Vy 有 微小 偏差 的 电压 组 成 。 
参考 电压 大 约 是 2 伏 ， 两 个 逻辑 值 用 与 参考 电压 上 下 偏差 0.3 伏 的 电压 表示 。 这 种 类 型 的 信号 一 般 
称 为 微分 信号 。 小 的 电压 浮动 占用 较 短 的 传输 时 间 ， 因 此 可 以 实现 更 快 的 传输 速度 。 

微分 信号 和 高 传输 速率 需要 在 设计 通讯 连接 线 时 使 用 特殊 的 技术 ， 这 种 需求 增加 了 拓宽 总 
线 的 难度 。 它 还 需要 为 处 理 微分 信号 设计 特别 的 电路 接口 。Rambus 提 供 了 设计 这 种 线路 的 完整 
规范 ， 称 为 Rambus 通 道 。 现 在 的 Rambus 设 计 人 允许 400MHz 的 时 钟 频率 ， 此 外 ， 数 据 在 时 钟 信号 
的 两 个 边沿 上 传输 ， 因 此 有 效 数据 传输 速率 是 800MHz。 

Rambus 需 要 特别 设计 的 芯片 ， 这 些 芯 片 使 用 基于 标准 DRAM 技 术 的 存储 单元 阵列 ， 使 用 多 
体 单 元 阵列 同时 访问 多 个 字 ， 与 Rambus 通 道 交互 需要 的 电路 包含 在 芯片 内 部 。 这 种 芯片 称 为 
Rambus 动 态 随机 存储 器 (RDRAM )。 

Rambus 最 初 的 标准 提供 了 一 个 由 9 条 数据 线 、 一 些 控制 线 和 电源 线 组 成 的 通道 ， 其 中 8 条 数 
据 线 用 于 传输 一 个 字 节 的 数据 ， 第 9 根 数据 线 可 以 用 于 奇偶 校 验 等 用 途 。 后 来 的 标准 允许 附加 的 
通道 。 两 通道 Rambus 称 为 直接 RDRAM， 它 有 18 条 数据 线 ， 能 同时 传输 两 字 节 数据 ， 没 有 单独 
的 地 址 线 。 

在 处 理 器 或 其他 作为 主 设备 的 设备 与 作为 从 设备 的 RDRAM 模 块 之 间 的 通讯 ， 通 过 在 数据 线 
上 传输 信息 包 的 方法 来 实现 。 有 三 种 类 型 的 信息 包 ， 分 别 是 请 求 、 响 应 和 数据 。 由 主 设 备 发 出 
的 请 求 包 指明 要 执行 的 操作 类 型 ， 它 包含 期 望 的 存储 器 位 置 的 地 址 ， 还 包括 一 个 8 位 的 计数 器 ， 
用 来 指定 要 传输 多 少 个 字 节 。 操 作 类 型 包括 存储 器 读 和 写 ， 还 包括 读 写 RDRAM 芯 片 的 各 个 控制 
寄存 器 。 当 主 设备 发 出 请 求 包 后 ， 如 果 地 址 选 定 的 从 设备 能 立刻 满足 这 个 请 求 ， 那 么 它 发 回 -一 
个 肯定 的 响应 包 作 为 回应 ， 否 则 发 回 一 个 否定 的 响应 包 表 示 正 忙 ， 这 时 主 设备 将 会 重 试 。 

请 求 包 的 位 数 超过 了 数据 线 的 条 数 ， 这 意味 着 需要 几 个 时 钟 周期 才能 传送 整个 包 。 窄 的 通 
讯 连接 可 以 用 高 传输 速率 来 弥补 。 

RDRAM 已 片 可 以 组 装 成 更 大 的 模块 ， 类 似 于 SIMM 和 DIMM 。 一 个 这 样 的 模块 称 为 RIMM ， 
它 能 支持 16 个 RDRAM.。 

Rambus 技 术 直 接 与 DDR SDRAM 技 术 竞 争 ， 它 们 各 自 有 各 自 的 优点 和 缺陷 。 一 个 非 技 术 因 
RE., DDR SDRAM 的 规范 是 一 个 开放 的 标准 ， 而 RDRAM 是 Rambus 公 司 私有 的 设计 方案 ， 世 
片 生产 商 必 须 为 此 付 使 用 费 。 最 后 我 们 应 该 记 住 ， 在 存储 器 市 场 ， 假 设 性 能 都 能 满足 要 求 ， 那 
么 组 件 的 价格 往往 是 决定 性 因素 。 


5.3 只 读 存储 器 
SRAM 和 DRAM 芯 片 都 是 易 失 的 ， 这 意味 着 当 电源 关闭 后 ， 它 们 存储 的 信息 将 会 委 失 。 有 
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很 多 应 用 要 求 存储 器 芯片 在 电源 关闭 后 仍 能 保留 它 所 存储 的 信息 。 例 如 ， 在 典型 的 计算 机 中 ， 
硬盘 驱动 器 用 来 保存 大 量 的 信息 ， 包 括 操作 系统 软件 。 当 计算 机 开机 时 ， 必 须 把 操作 系统 从 硬 
盘 中 装 入 内 存 ， 这 需要 执行 一 个 引导 操作 系统 的 程序 。 由 于 引导 程序 很 大 ， 它 的 大 部 分 都 存储 
在 磁盘 上 ， 处 理 器 必须 执行 一 些 指令 把 引导 程序 装 入 内 存 。 如 果 整 个 存储 器 都 是 由 易 失 的 存储 
器 芯片 构成 的 ， 那 么 处 理 器 将 没有 办 法 访问 这 些 指令 。 一 种 实用 的 解决 办 法 是 提供 一 小 块 非 易 
失 性 的 存储 器 来 保存 从 磁盘 装 入 引导 程序 的 指令 。 

非 易 失 存储 器 广泛 应 用 于 代入 式 系统 ， 这 将 在 第 9 章 中 介绍 。 这 种 系统 通常 不 使 用 磁盘 存储 
设备 ， 它 们 的 程序 存储 在 非 易 失 的 半导体 存储 器 设备 中 。 

现在 已 经 开发 了 不 同类 型 的 非 易 失 存储 器 ， 一 般 可 以 像 使 用 SRAM 和 DRAM 一 样 读 取 它 们 
的 内 容 。 但 是 ， 把 信息 存 人 这 些 存 储 器 需要 特殊 的 写 过 程 。 因 为 它们 一 般 的 操作 只 涉及 读 取 存 
储 数据 ， 因 此 这 种 类 型 的 存储 器 称 为 只 读 存储 器 (ROM)。 


5.3.1 ROM 


图 5-12 显 示 了 一 种 可 能 的 ROM 单 元 结构 ,如果 晶体 管 在 P 点 接地 , 那么 单元 存储 的 逻辑 值 为 0， 
否则 为 1。 位 线 通 过 一 个 电阻 连 到 电源 线 上 。 
要 读 取 单 元 的 状态 ， 需 要 激活 字 线 ， 这 样 晶 
体 管 开关 闭合 。 如 果 晶 体 管 接地 的 话 ， 位 线 
上 的 电压 会 接近 0 电位 ; 如 果 没有 接地 的 话 ， 
位 线 上 的 电压 仍然 保持 高 电位 ,表示 逻辑 值 1。 oo 
位 线 末 端的 传 感 电路 产生 正确 的 输出 值 。 数 A a 连接 时 存储 “0” 





P > 
据 是 在 ROM 制 造 时 被 写 人 的 。 的 不 连接 时 存储 “> 
5.3.2 PROM = 

有 些 ROM 设 计 成 由 用 户 装 人 数据 ， 即 可 图 5-12 只 读 存储 器 单元 


编程 只 读 育 储 器 (PROM)。 可 编程 能 力 是 通过 在 图 5-12 中 的 P 点 插入 一 根 粹 丝 实现 的 。 在 编程 
之 前 ， 存 储 器 包含 的 内 容 全 是 0， 用 户 可 以 通过 使 用 高 电流 脉冲 把 所 需 位 置 的 熔 丝 烧 断 ， 使 那些 
位 置 的 值 为 1。 当 然 ， 这 个 过 程 是 不 可 逆 的 。 

”PROM 提 供 了 ROM 不 具备 的 灵活 性 和 方便 性 。 后 者 在 存储 固定 的 程序 和 数据 且 大 量 生产 
ROM 的 情况 下 ， 具 有 很 大 的 经 济 吸 引力 。 但 是 ， 如 果 只 需要 很 少数 量 ， 为 准备 存储 特定 信息 需 
要 的 掩 码 所 付出 的 成 本 使 得 它们 非常 昂贵 。 在 这 种 情况 下 ，PROM 提 供 了 一 种 更 快 而 且 非 常 廉 
价 的 方法 ， 因 为 它们 可 以 直接 由 用 户 编程 。 


5.3.3 EPROM 


另 一 种 ROM 蕊 片 允 许 控 除 存储 的 数据 ， 并 装 和 新 的 数据 ， 这 种 可 擦 除 、 可 再 编程 的 ROM 通 
常 称 为 可 擦 除 可 编程 只 读 存储 器 (EPROM )， 它 在 数字 系统 的 开发 阶段 提供 了 相当 大 的 灵活 性 。 
因为 EPROM 能 在 很 长 的 时 间 内 保存 数据 ， 所 以 当 软 件 正在 被 开发 的 时 候 ， 它 们 可 以 替换 ROM. 
通过 这 种 方法 ， 可 以 很 容易 地 实现 存储 信息 的 改变 和 升级 。 

EPROM 存 储 单元 的 结构 与 图 5-12 中 的 ROM 单 元 相似 。 但 是 ， 在 EPROM 的 单元 中 ，P 点 总 是 
接地 的 ， 而 且 它 使 用 特殊 的 晶体 管 ， 这 个 晶体 管 既 可 以 当 作 普 通 品 体 管用 ，、 也 可 以 当 作 总 是 关 
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闭 状 态 的 无 效 晶体 管用 。 可 以 对 晶体 管 编程 使 它 成 为 一 个 始终 打开 的 开关 ， 这 种 方式 可 以 通过 
向 它 注 人 电荷 来 实现 ， 注 入 的 电荷 被 内 部 捕获 。 这 样 ，EPROM 存 储 单元 可 以 用 前 面 讨 论 的 ROM 
单元 所 用 的 方法 来 构建 存储 器 。 

EPROM 芯片 的 主要 优势 是 可 以 对 它 的 内 容 进 行 擦 除 和 重新 编程 。 控 除 需 要 驱散 存储 单元 中 
的 蝇 体 管 捕获 的 电荷 ， 这 可 以 通过 把 芯片 暴露 在 紫外 线 下 照射 来 完成 。 由 于 这 个 原因 ，EPROM 
心 睛 被 安装 在 有 透明 窗口 的 外 壳 中 。 


5.3.4 EEPROM 


EPROM 的 一 个 重要 不 足 是 重新 编程 时 芯片 必须 从 电路 上 物理 移 除 ， 而 且 被 紫外 线 照 射 时 它 
的 所 有 内 容 都 会 被 按 除 。 可 以 实现 另 一 版 本 的 可 擦 除 PROM， 它 可 以 用 电 来 皖 除 和 编程 ， 这 样 
的 芯片 叫做 电 可 擦 除 可 编程 只 读 存 储 器 (EEPROM)， 擦 除 时 不 需要 把 它 从 电路 上 移 除 ， 还 可 以 
有 选择 地 擦 除 存 储 单元 中 的 内 容 。EEPROM 惟 一 的 不 足 是 掠 除 、 写 数据 和 读数 据 需 要 用 不 同 的 
电压 。 


5.3.5 闪存 


最 近 ， 一 种 与 EEPROM 技 术 类 似 的 解决 办 法 出 现 了 ， 它 就 是 闪存 (flash memory) 设备 。 闪 
存单 元 的 基础 是 一 个 被 捕获 电荷 控制 的 单独 晶体 管 ， 就 像 EEPROM 一 样 。 虽 然 有 些 方面 类 似 ， 
但 是 内 在 和 EEPROM 还 是 有 本 质 上 的 不 同 。 在 EEPROM 中 可 以 读 取 和 写 人 单个 单元 中 的 内 容 ， 
而 在 内 存 中 可 以 读 取 单 个 单元 的 内 容 ， 但 只 能 写 人 整 块 单元 的 内 容 。 在 写 之 前 ， 这 个 块 以 前 存 
储 的 内 容 被 擦 除 。 闪 存 有 更 高 的 密度 ， 这 可 以 带 来 更 高 的 容量 和 更 低 的 成 本 。 它 们 只 需要 单一 
的 电压 ， 而 且 在 操作 中 消耗 更 少 的 能 量 。 

低 功 耗 使 得 内 存在 由 电池 驱动 的 便携 式 设 备 应 用 中 有 很 强 的 吸引 力 。 典 型 的 应 用 包括 手持 
计算 机 、 蜂 窝 电 话 、 数 码 相 机 和 MP3 音 乐 播放 器 。 在 手持 计算 机 和 蜂窝 电话 中 ， 闪 存 保存 操作 
设备 需要 的 软件 ， 这 样 就 免除 了 对 磁盘 的 需求 。 在 数码 相机 中 ， 内 存 用 来 保存 相片 的 图 像 数 据 。 
在 MP3 播 放 器 中 ， 内 存 存储 表现 声音 的 数据 。 蜂 窝 电 话 、 数 码 相机 和 MP3 播 放 器 是 很 好 的 马 入 
式 系 统 的 例子 ， 这 些 将 在 第 9 章 详 细 讨论 。 

单独 的 内 存 芯片 不 能 为 上 面 提 到 的 应 用 提供 足够 的 存储 容量 ， 它 们 需要 由 多 个 芯片 组 成 更 
大 的 存储 器 模块 。 实 现 这 样 的 模块 时 有 两 种 常见 的 选择 : 办 存 卡 和 闪存 驱动 器 。 

闪存 卡 

构建 更 大 模块 的 一 个 方法 是 把 办 存 芯片 安装 到 一 个 小 卡片 上 ， 这 样 的 闪存 卡 有 一 个 标准 的 
接口 ， 它 们 可 以 用 在 不 同 的 产品 上 。 卡 片 只 需要 简单 地 插入 到 一 个 可 以 很 方便 地 接触 到 的 槽 上 。 
内 存 卡 有 不 同 的 容量 ， 典 型 的 容量 是 8M、32M 和 64M 字 节 。 使 用 MP3 编 码 格式 时 ， 一 分 钟 音乐 
可 以 存储 在 大 约 1M 字 节 的 存储 器 中 ， 因 此 ， 一 个 64M 的 办 存 卡 可 以 存储 一 小 时 的 音乐 。 

闪存 驱动 器 

更 大 容量 的 闪存 模块 已 经 被 开发 出 来 ， 可 以 替换 硬盘 驱动 器 ， 这 些 闪 存 驱 动 器 完全 仿效 硬 
盘 设 计 ， 它 们 可 以 装 入 标准 的 磁盘 驱动 器 架 中 。 但 是 闪存 驱 动 器 的 存储 容量 太 低 了 ， 目 前 闪存 
的 容量 小 于 1G 字 节 。 相 反 地 ， 硬 盘 能 存储 很 多 G 字 节 。 

闪存 驱动 器 是 固态 电子 设备 ,没有 可 动 的 部 分 ， 这 为 它 提供 了 一 些 重要 的 优点 。 它 们 有 更 
短 的 搜索 和 访问 时 间 ， 从 而 有 更 短 的 响应 时 间 (搜索 和 访问 时 间 在 5.9 节 介绍 磁盘 时 讨论 )。 它 们 
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有 更 低 的 功 耗 ， 使 其 在 电池 驱动 的 应 用 中 有 很 大 的 吸引 力 ， 而 且 受 震动 的 影响 很 小 。 

与 硬盘 驱动 器 相 比 ， 内 存 驱 动 器 的 缺点 是 它们 的 容量 比较 小 ， 而 且 每 位 的 成 本 比较 高 。 硬 
盘 每 位 的 成 本 非常 低 。 内 存 的 另 一 个 不 足 是 多 次 写 人 后 它 会 退化 ， 幸 运 的 是 这 个 次 数 很 大 ， 一 
般 至 少 是 一 百 万 次 。 


5.4 速度 、 容 量 和 成 本 


我 们 已 经 说 过 ， 理 想 的 存储 器 应 该 是 高 速度 、 大 容量 和 低 价格 的 。 从 5.2 节 的 讨论 中 已 经 清 
楚 地 了 解 到 用 SRAM 芯 片 可 以 实现 非常 快 的 存储 器 ， 但 是 由 于 它们 的 基本 单元 有 六 个 晶体 管 ， 
不 能 在 一 个 芯片 上 安放 大 量 的 单元 ， 所 以 很 昂贵 。 因 此 ， 出 于 成 本 原因 ， 使 用 SRAM 芯 片 构建 
大 存储 器 是 不 现实 的 。 另 一 个 可 选 的 办 法 是 使 用 DRAM 芯 片 ， 它 们 有 非常 简单 的 基本 单元 ， 因 
此 也 便宜 很 多 ， 但 是 这 样 的 存储 器 也 要 慢 得 多 。 

虽然 动态 存储 器 部 件 可 以 用 合理 的 成 本 实现 数 百 兆 字 节 的 容量 ， 但 是 可 提供 的 容量 与 有 庞 
大 数据 的 大 程序 要 求 相 比 还 是 很 小 的 。 一 个 解决 办 法 是 使 用 辅助 存储 设备 来 实现 大 的 存储 器 空 
间 ， 这 主要 是 磁盘 。 以 合理 的 价格 可 以 得 到 容量 非常 大 的 磁盘 ， 而 且 它们 在 计算 机 系统 中 被 广 
泛 地 使 用 ， 但 要 比 半导体 存储 器 慢 得 多 。 所 以 我 们 可 以 得 出 结论 ， 划 算 的 海量 存储 可 以 由 磁盘 
来 提供 。 一 个 可 以 提供 的 大 容量 主 存 使 用 动态 随机 存储 器 来 构建 。 静 态 随机 存储 器 用 在 更 小 的 
部 件 中 ， 这 些 部 件 中 速度 极其 重要 ， 例 如 高 速 缓存 。 

所 有 这 些 不 同类 型 的 存储 器 部 件 都 有 效 地 在 计算 机 中 使 用 ， 计 算 机 的 整个 存储 器 可 以 看 作 
在 图 5-13 中 描述 的 分 层 结构 。 最 快 的 访问 是 对 保存 在 处 理 器 寄存 器 中 数据 的 访问 ， 因 此 ， 如 果 
把 处 理 器 寄存 器 看 作 存 储 器 层次 结构 的 一 部 分 的 话 ， 那 么 就 访问 速度 而 言 ， 处 理 器 寄存 器 位 于 
最 顶端 。 当 然 ， 寄 存 器 只 提供 了 所 需 存 储 器 的 一 个 很 小 部 分 。 

在 层次 结构 中 的 下 一 层 是 相对 来 说 容量 
较 小 的 存储 器 ， 它 们 可 以 直接 在 处 理 器 内 部 
实现 。 这 个 存储 器 称 为 处 理 器 高 速 丝 在， 用 
来 保存 存储 在 外 部 更 大 存储 器 中 的 指令 和 数 。 “un 人 
据 的 拷贝 。 高 速 级 存 概念 在 图 1-6 中 引入 ， 区 
在 5.5 节 中 有 详细 分 析 。 通 常 有 两 级 高 速 缓 
存 。 主 高 速 缓存 总 是 放 在 处 理 器 芯片 内 部 ， 


寄存 器 





这 个 高 速 缓存 很 小 ， 因 为 它 要 抢占 处 理 器 芯 mc 
片 的 空间 ， 而 这 个 空间 还 要 实现 很 多 其 他 的 L | 
功能 。 主 高 速 缓 存 称 为 一 级 (L1) S: | 
看。 一 个 更 大 的 辅助 高 速 缓存 放 在 主 高 速 组 ng 
存 和 其 余 存储 器 之 间 ， 这 称 为 二 级 (L2) | sema | 
高 速 缓 存 ， 它 通常 用 静态 随机 存储 器 芯片 来 I 
实现 。 m 
在 处 理 器 芯片 中 包含 一 个 主 高 速 缓存 ， EA 
再 使 用 一 个 更 大 的 芯片 外 的 二 级 高 速 缓存 ， L—— 
这 是 当前 设计 计算 机 最 通用 的 方法 。 但 是 ， 图 5-13 存储 器 层次 结构 


在 现实 中 还 能 找到 其 他 的 设计 ， 可 能 在 处 理 器 芯片 上 根本 没有 高 速 缓存 ， 也 可 能 把 一 级 和 二 级 
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高 速 缓存 都 放 到 处 理 器 芯片 中 。 

层次 结构 的 再 往 下 一 层 称 为 主 存储 器 ， 这 是 用 动态 存储 器 部 件 实现 的 一 个 很 大 的 存储 器 ， 
通常 采用 SIMM、DIMM 或 RIMM 的 形式 。 主 存 很 大 ， 但 是 比 高 速 缓存 要 慢 得 多 。 在 一 个 典型 的 
计算 机 中 ， 主 存 的 访问 时 间 大 约 比 一 级 高 速 缓存 的 访问 时 间 长 十 倍 。 

磁盘 设备 提供 廉价 的 大 容量 存储 ， 与 用 于 主 存 的 半导体 设备 相 比 ， 它 们 是 非常 慢 的 。 我 们 
将 在 5.9 节 中 讨论 磁盘 技术 。 

在 程序 执行 期 间 ， 存 储 器 访问 速度 是 至 关 重要 的 。 管 理 图 5-13 中 存储 器 分 层 系 统 操作 的 关 
键 是 把 最 近 要 使 用 的 指令 和 数据 放 到 离 处 理 器 尽 可 能 近 的 地 方 ， 这 可 以 使 用 随后 章节 描述 的 机 
制 来 完成 。 我 们 首先 来 详细 讨论 一 下 高 速 缓 存 。 
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与 现代 的 处 理 器 相 比 ， 主 存 的 速度 是 非常 低 的 。 为 了 获得 更 高 的 效能 ， 处 理 器 不 能 花费 时 
间 去 等 待 从 主 存 中 获取 指令 和 数据 。 因 此 ， 设 计 一 种 能 减少 访问 所 需 信息 需要 时 间 的 方案 是 很 
重要 的 。 因 为 主 存 部 件 的 速度 受 电气 约束 和 封装 约束 的 限制 ， 所 以 解决 办 法 必须 在 不 同 的 体系 
结构 设计 中 寻求 。 一 个 有 效 的 解决 办 法 是 使 用 一 个 快速 的 高 速 组 奋 ， 这 实质 上 是 使 主 存 对 处 理 
器 而 言 比 实际 上 表现 得 更 快 -- 些 。 

高 速 缓存 机 制 的 有 效 性 是 以 计算 机 程序 的 引用 局 部 性 特征 为 基础 的 。 对 程序 的 分 析 显示 它 
们 大 部 分 的 执行 时 间 花 在 过 程 中 ， 其 中 有 很 多 指令 被 重复 执行 。 这 些 指令 可 能 包括 一 个 简单 的 
循环 、 娩 套 的 循环 或 一 些 反复 互相 调用 的 过 程 。 指 令 序列 的 具体 模式 并 不 重要 ， 关 键 是 在 一 段 
时 间 内 程序 局 部 区 域 的 很 多 指令 被 反复 执行 ， 而 程序 的 其 他 部 分 相对 来 说 很 少 被 访问 ， 这 称 为 
引用 局 部 性 。 它 表现 在 两 个 方面 : 时 间 和 空间 上 。 时 间 方 面 意味 着 最 近 执 行 的 指令 可 能 很 快 又 
被 执行 到 ， 而 空间 方面 意味 着 与 最 近 执 行 指令 邻近 (就 指令 地 址 而 言 ) 的 指令 也 可 能 很 快 被 执 
行 到 。 

如 果 程 序 的 活动 段 能 被 放 到 高 速 缓存 中 ， 那 么 总 的 执行 时 间 就 会 大 幅 减少 。 从 概念 上 说 ， 
高 速 缓存 的 操作 非常 简单 。 存 储 器 控制 电路 利用 引用 局 部 性 特征 而 设计 。 引 用 局 部 性 的 时 间 方 
面 指出 只 要 信息 项 (指令 或 数据 ) 是 最 先 需要 的 ， 那 么 它 应 该 被 放 入 高 速 缓 在， 在 高 速 缓存 中 
可 能 被 保留 直到 需要 它 。 空 间 方面 指出 不 要 每 次 只 从 主 存 中 取 一 项 放 到 高 速 缓存 中 ， 取 邻近 地 
址 的 多 个 项 是 很 有 用 的 。 我 们 将 用 术语 决 来 指明 一 定 大 小 的 一 组 邻近 地 址 位 置 。 另 一 个 经 常用 
来 说 明 高 速 缓存 块 的 术语 是 高 速 给 存 块 。 

考虑 图 5-14 中 简单 的 布局 。 当 从 处 理 器 接收 到 一 个 读 请 求 时 ， 包 含 指定 单元 的 一 块 存储 器 
字 的 内 容 被 传 到 高 速 缓 存 ， 每 次 传 一 个 字 。 
然后 ， 当 程序 引用 这 个 块 中 任何 单元 时 ， 所 
需 内 容 直 接 从 高 速 缓存 中 读 取 。 通 常 高 速 组 
存在 给 定时 刻 能 保存 合理 数量 的 块 ， 但 这 个 “| 47 
块 数 与 主 存 中 所 有 的 块 数 相 比 还 是 要 小 得 多 。 

主 存 块 与 高 速 缓存 块 的 对 应 关系 由 映射 功能 

指定 。 当 高 速 缓存 已 经 满 了 ， 而 且 高 速 缓存 图 5-14 高 速 缓存 的 使 用 

外 的 一 个 存储 器 字 (指令 或 数据 ) 被 引用 时 ， 高 速 缓存 控制 硬件 必须 决定 移出 哪 一 个 块 ， 为 包 
含 被 引用 字 的 新 块 腾 出 空间 。 做 出 这 种 决定 的 规则 集合 构成 了 替换 算法 。 
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处 理 器 不 需要 知道 高 速 缓存 的 存在 ， 它 简单 地 使 用 指向 内 存单 元 的 地 址 发 出 读 写 请 求 。 高 
速 缓存 控制 电路 判 浙 请 求 的 字 当前 是 否 存在 于 高 速 缓存 中 。 如 果 在 ， 那 么 读 写 操作 直接 在 恰当 
的 高 速 缓存 位 置 执行 ， 这 时 称 为 读 写 命中 。 在 读 操作 中 并 不 涉及 主 存 。 在 写 操作 中 ， 系 统 可 以 
按 两 种 方法 处 理 。 第 一 种 技术 称 为 直接 写 协 议 ， 高速 缓 存单 元 和 主 存单 元 同时 更 新 。 第 二 种 技 
术 只 更 新 高 速 缓 存单 元 ， 并 更 新 与 该 单元 关联 的 标志 位 ， 这 个 标志 位 称 为 脏 位 或 修改 位 。 主 存 
单元 以 后 修改 ， 它 的 修改 是 在 当 包含 这 种 标记 字 的 块 为 新 块 腾 出 空间 而 被 移出 高 速 缓存 时 进行 
的 。 这 个 技术 称 为 写 回 协议 。 直 接 写 协议 很 简单 ， 但 是 当 一 个 给 定 的 高 速 缓存 字 在 高 速 缓存 期 
间 被 多 次 更 新 时 ， 直 接 写 会 造成 不 必要 的 对 主 存 写 操作 。 注 意 写 回 协议 也 可 能 造成 不 必要 的 写 
操作 ， 因 为 当 一 个 高 速 缓存 块 被 写 回 到 主 存 时 ， 块 中 所 有 的 字 都 被 写 回 ， 即 使 这 个 块 在 高 速 组 
存 中 只 有 一 个 字 被 修改 过 。 

当 读 操作 地 址 对 应 的 字 没 有 在 高 速 缓存 中 的 时 候 ， 发 生 一 次 读 失效 。 这 时 ， 包 含 所 请 求 字 
的 一 个 块 从 主 存 中 读 进 高 速 缓存 。 整 个 块 装 进 高 速 缓存 后 ， 请 求 的 这 个 字 传 送 给 处 理 器 。 一 种 
替代 的 方法 是 字 一 旦 从 主 存 中 读 出 ， 就 立刻 送 到 处 理 器 。 后 一 种 方法 称 为 直接 装 入 或 早 重 启 ， 
它 在 一 定 程度 上 减少 了 处 理 器 等 待 的 时 间 ， 但 是 需要 更 复杂 的 电路 ， 成 本 更 高 。 

在 写 操作 期 间 ， 如 果 地 址 对 应 的 字 不 在 高 速 缓存 中 ， 就 发 生 一 次 写 失 效 。 此 时 ， 如 果 使 用 
直接 写 方式 ， 那 么 信息 直接 写 人 主 存 。 如 果 是 写 回 方式 ， 那 么 该 地 址 对 应 字 的 块 首先 被 装 和 高 
速 缓存 ， 然 后 高 速 缓 存 中 对 应 的 字 被 新 信息 覆盖 。 


5.5.1 映射 功能 


为 了 讨论 用 于 指定 存储 器 块 被 放 入 高 速 缓 存 哪 个 位 置 的 方法 ， 我 们 使 用 一 个 很 小 的 例子 。 
考虑 一 个 包含 128 个 块 的 高 速 缓存 ， 每 个 块 有 16 个 字 ， 总 容量 是 2048 (2K) 个 字 。 假 设 主 存 用 16 
位 地 址 编 址 。 主 存 有 64K 的 字 ， 我 们 把 它 看 作 4K 个 16 个 字 的 块 。 为 简便 起 见 ， 假 设 连续 的 地 址 
对 应 连续 的 字 。 

直接 映射 

决定 主 存 块 在 高 速 缓存 中 位 置 的 最 简单 方法 是 直接 映射 技术 。 在 这 项 技术 中 ， 主 存 块 了 映 
射 到 高 速 缓 存 的 模 128 的 块 / 上 ， 如 图 5-15 中 所 示 。 这 样 ， 只 要 是 第 0、128、256、… 个 主 存 块 装 
和 人 高 速 缓 在 ， 它 们 都 存储 在 高 速 缓存 的 第 0 块 ， 依 次 类 推 。 因 为 多 个 主 存 块 被 映射 到 指定 的 一 个 
高 速 缓 存 块 ， 所 以 即使 高 速 缓存 设 有 满 ， 在 该 单元 上 也 可 能 引起 冲突 。 例 如 ， 一 个 程序 的 指令 
可 能 从 第 1 块 开始 ， 接 着 可 能 在 一 个 转移 语句 后 跳 到 第 129 块 。 当 这 个 程序 执行 时 ， 这 两 个 块 都 
被 传输 到 高 速 缓 存 的 第 1 块 。 可 以 通过 允许 新 块 覆盖 已 存在 的 块 来 解决 这 种 冲突 ， 但 是 这 样 的 替 
换 价值 不 大 。 

高 速 缓存 块 的 放置 由 主 存 地 址 决定 ， 主 存 地 址 可 以 分 成 三 个 字段 ， 如 图 $-15 所 示 。 低 4 位 
从 16 个 字 的 块 中 选择 一 个 字 。 当 新 块 进入 高 速 缓存 的 时 候 ，7 位 的 高 速 缓存 块 字段 决定 这 个 块 
存 入 高速 缓存 中 哪个 位 置 。 块 的 主 存 地 址 的 高 5 位 存在 5 个 标志 位 中 ， 与 高 速 缓存 块 中 的 位 置 关 
联 ， 它 们 标志 映射 到 这 个 单元 的 32 个 块 中 哪 一 个 当前 正在 高 速 缓存 中 。 在 执行 过 程 中 ， 由 处 理 
器 产生 的 每 个 地 址 的 7 位 高 速 缓存 块 字段 指向 高 速 缓存 中 特定 的 单元 。 地 址 的 高 5 位 和 与 高 速 组 
存单 元 关联 的 标志 位 做 比较 。 如 果 匹 配 ， 期 望 的 字 就 在 那个 高 速 缓存 块 中 ;， 如 果 不 匹配 ， 包 含 


期 望 字 的 块 必 须 首 先 从 主 存 中 读 出 并 装 和 人 高速 缓 在 中 。 直 接 映射 技术 很 容易 实现 ， 但 是 不 是 很 
灵活 。 
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图 5-15 直接 映射 高 速 缓存 


相 联 映射 

图 5-16 给 出 了 一 种 更 灵活 的 映射 方法 ， 通 过 它 可 以 把 主 存 块 放置 到 高 速 缓存 中 任何 一 个 位 
置 上 。 在 这 种 情况 下 ， 当 一 个 主 存 块 在 高 速 缓存 中 的 时 候 ， 需 要 12 位 标志 去 标记 它 。 从 处 理 器 
接收 的 地 址 标志 位 与 高 速 缓存 每 个 块 的 标志 位 做 比较 ， 看 需要 的 块 是 否 存在 。 这 称 为 相 联 映射 
技术 ， 它 可 以 完全 自由 地 选择 在 哪个 高 速 缓存 位 置 上 放置 主 存 块 。 这 样 ， 高 速 缓 存 空间 可 以 得 
到 更 有 效 的 利用 。 只 有 在 高 速 缓 存 满 了 ， 又 需要 放 入 高 速 缓存 块 时 才 必 须 从 高 速 缓存 中 替换 出 
一 个 已 经 存在 的 块 。 在 这 种 情况 下 ,需要 一 个 算法 选择 出 哪个 块 将 要 被 换 出 。 可 以 有 多 种 算法 
进行 选择 ， 我 们 将 在 5.5.2 节 中 讨论 。 相 联 映射 高 速 缓 存 的 成 本 比 直接 映射 高 速 缓 存 要 高 ， 因 为 
它 要 检索 所 有 128 个 标志 的 值 ， 判 断 给 定 的 块 是 否 在 高 速 缓 存 中 。 这 种 检索 称 为 相 联检 索 。 由 于 
性 能 的 原因 ， 标 志 必 须 并 行 地 被 检索 。 

组 相 联 映射 

直接 映射 技术 和 相 联 映射 技术 可 以 结合 起 来 使 用 。 高 速 缓存 的 块 被 分 成 组 ， 这 种 映射 允许 
主 存 块 可 以 位 于 特定 组 中 的 任何 一 个 块 中 。 这 样 ， 放 置 块 时 可 以 有 多 个 选择 ， 从 而 使 直接 映射 
方法 的 冲突 问题 得 到 缓解 。 同 时 ， 通 过 减少 相 联检 索 的 大 小 可 以 降低 硬件 成 本 。 图 5-17 给 出 了 
一 个 组 相 联 映射 技术 的 例子 ， 高 速 缓存 中 每 个 组 有 两 个 块 。 这 样 ， 第 0、64、128… 个 主 存 块 映 
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图 5-16 相 联 映射 高 速 缓存 


射 到 高 速 缓存 的 第 0 组 ， 它 们 可 以 占用 这 个 组 的 两 个 位 置 中 的 任意 一 个 。 有 64 个 组 时 ， 就 意味 着 
地 址 的 6 位 组 字段 决定 高 速 缓存 中 的 哪个 组 可 能 包含 期 望 的 块 。 地 址 的 标志 字段 与 这 个 组 两 个 块 
的 标志 做 比较 ， 检 查 所 需要 的 块 是 否 存在 。 这 两 种 方法 相 结合 的 检索 方法 实现 起 来 很 简单 。 

每 组 的 块 数 可 以 作为 一 个 参数 ， 根 据 特定 计算 机 的 需求 进行 选择 。 对 于 图 5-17 中 的 主 存 和 
高 速 缓 存 的 容量 来 说 ，5 位 的 组 字段 可 以 满足 每 组 4 个 块 ，4 位 的 组 字段 可 以 满足 每 组 8 个 块 ， 依 
次 类 推 。 每 组 128 个 块 的 极端 情况 不 需要 组 字段 ， 它 对 应 完全 相 联 技术 ， 有 12 个 标志 位 。 另 一 个 
极端 情况 是 每 组 只 有 一 个 块 ， 这 就 是 直接 映射 方法 。 每 组 有 k 个 块 的 高 速 缓 存 称 为 路 组 相 联 高 
速 缓存 。 

每 个 块 还 需要 提供 另 一 个 控制 位 ， 称 为 有 获 位 ， 这 个 位 表示 这 个 块 是 否 包含 有 效 数 据 。 不 
应 该 把 它 与 前 面 提 到 的 脏 位 或 修改 位 混淆 起 来 。 脏 位 表示 一 个 块 在 高 速 缓存 中 时 是 否 被 修改 过 ， 
它 只 有 在 系统 不 使 用 直接 写 方法 时 才 需 要 。 当 系统 电源 刚 接 通 或 主 存 从 磁盘 装 入 新 的 程序 和 数 
据 时 ， 所 有 的 有 效 位 都 被 置 成 0。 从 磁盘 到 主 存 的 传输 使 用 DMA 机 制 实 现 。 通 常 ， 出 于 成 本 和 性 
能 的 考虑 ， 它 们 绕 过 高 速 缓存 。 当 特定 的 高 速 缓存 块 第 一 次 从 磁盘 上 装 和 人 时 ， 它 的 有 效 位 设 成 1。 
只 要 主 存 块 被 不 经 过 高 速 缓 存 的 数据 源 更 新 时 ， 就 需要 做 一 次 检测 来 判断 装载 的 块 当前 是 否 在 
高 速 缓存 中 。 如 果 人 在， 那么 它 的 有 效 位 就 被 清 成 0。 这 样 就 能 保证 高 速 缓存 中 没有 过 时 的 数据 。 

当 完成 一 个 从 主 存 到 磁盘 的 DMA 传 输 并 且 高 速 缓存 使 用 写 回 协议 时 ， 会 出 现 一 个 类 似 的 难 
题 。 这 时 ， 主 存 中 的 数据 可 能 不 能 反映 出 对 高 速 缓存 中 的 备份 所 进行 的 修改 。 这 个 问题 的 一 个 解 
决 方法 就 是 转 储 清除 高 速 缓存 ， 在 DMA 传 输 开始 之 前 迫使 脏 数据 写 回 到 主 存 中 。 操 作 系 统 可 以 
很 容易 做 到 这 一 点 ， 而 且 这 对 性 能 的 影响 并 不 大 ， 因 为 这 样 的 磁盘 传输 发 生 的 频率 不 高 。 保 证 不 
同 实体 〈 这 里 指 处 理 器 和 DMA 子 系统 ) 使 用 相同 数据 备份 的 需求 称 为 高 速 组 看 一 致 性 问题 。 





BARR S í 2 





标志 组 F 
| 6 | ° |4 | tr 


图 5-17 每 组 两 个 块 的 组 相 联 映射 高 速 缓存 


5.5.2 替换 算法 


在 直接 映射 高 速 缓 存 中 ， 每 个 块 的 位 置 是 事先 决定 的 ， 因 此 不 存在 替换 策略 。 在 相 联 和 组 
相 联 高 速 缓存 中 存在 一 定 的 灵活 性 。 在 一 个 新 块 需要 放 入 高 速 缓 存 而 高 速 缓 存 中 所 有 单元 都 已 
经 满 了 的 情况 下 ， 高 速 缓 存 控制 器 必须 决定 娜 一 个 原 有 的 块 将 被 覆盖 。 这 是 一 个 很 重要 的 问题 ， 
因为 这 个 决定 是 系统 性 能 的 决定 性 因素 。 通 常 ， 我 们 的 目标 是 保留 那些 最 近 可 能 被 引用 的 高 速 
缓存 块 。 但 是 决定 哪 一 个 高 速 缓存 块 将 被 引用 并 不 是 一 件 容易 的 事 。 程 序 的 引用 局 部 性 特征 为 
找 出 一 个 合理 的 策略 提供 了 线索 。 因 为 程序 通常 在 一 个 局 部 区 域内 保留 相当 长 的 时 间 ， 所 以 最 
近 引 用 的 块 有 很 高 的 概率 再 次 被 引用 。 因 此 ， 如 果 有 一 个 块 要 被 覆盖 ，、 那 么 覆盖 最 长 时 间 没 有 
被 访问 的 那个 块 是 比较 合理 的 。 这 个 块 称 为 最 近景 少 使 用 (LRU) 块 ， 这 项 技术 称 为 LRU 赫 接 
算法 。 

要 使 用 LRU 算 法 ， 高 速 缓 存 控制 器 必须 在 进行 计算 时 跟踪 对 各 个 块 的 引用 。 假 设 在 每 组 四 
块 的 组 相 联 高 速 缓存 中 跟踪 LRU 块 ， 可 以 在 每 个 块 上 使 用 一 个 2 位 的 计数 器 。 命 中 时 ， 被 引用 块 
的 计数 器 被 设 成 0， 原 来 比 被 引用 块 的 计数 器 值 低 的 计数 器 都 增加 1， 其 他 的 保持 不 变 。 当 发 生 
缺 块 且 组 不 满 时 ， 与 从 主 存 中 装 入 的 新 块 相 联 的 计数 器 被 设 成 9， 其 余 块 的 计数 器 值 增 1。 当 发 
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生 缺 块 且 组 已 经 满 了 时 ， 计 数 器 值 为 3 的 块 被 移出 ， 新 块 放 到 被 移出 块 的 位 置 上 ， 它 的 计数 器 设 
成 0， 其 他 三 个 块 计 数 器 增 1。 很 容易 证 明 被 占用 块 的 计数 器 值 总 是 不 同 的 。 

LRU 算 法 被 广泛 地 使 用 。 虽 然 它 在 很 多 访问 模式 下 表现 得 很 好 ， 但 是 在 某 些 情况 中 会 导致 
很 差 的 性 能 。 例 如 ， 在 顺序 访问 一 个 比较 大 ， 无 法 全 部 装 入 高 速 缓 存 的 数组 元 素 时 ， 它 将 产生 
令 人 失望 的 结果 (参见 5.5.3 节 和 习题 5.12)。 可 以 用 在 决定 哪个 块 被 替换 时 引入 少量 随机 性 来 提 
高 LRU 算 法 的 性 能 。 

实践 中 也 使 用 一 些 其 他 的 替换 算法 。 直觉 上 一 个 合理 的 规则 应 该 是 装 入 新 块 时 移出 一 个 已 
经 满 了 的 组 中 最 旧 的 块 。 但 是 ， 因 为 这 个 算法 没有 考虑 最 近 访 问 高 速 缓 存 块 的 模式 ， 所 以 在 选 
择 最 合适 的 块 被 移出 时 通常 不 如 LRU 算 法 有 效 。 最 简单 的 算法 是 随机 选择 一 个 块 覆盖 ， 有 趣 的 
是 ， 人 们 发 现 这 个 简单 的 算法 在 实际 中 非常 有 效 。 


5.5.3 映射 技术 的 例子 


现在 来 考虑 一 个 详细 的 例子 ， 说 明 不 同 映射 技术 的 效果 。 假 设 处 理 器 有 单独 的 指令 高 速 组 
存 和 数据 高 速 缓存 。 为 了 使 例子 简单 ， 假 设 数据 高 速 缓存 只 有 容纳 8 块 数据 的 空间 ， 同 时 假设 每 
块 由 一 个 16 位 字 的 数据 组 成 ， 存 储 器 是 按 字 可 编 址 的 ， 它 有 16 位 地 址 (这 些 参 数 在 实际 计算 机 
中 并 不 真实 ， 但 是 这 可 以 让 我 们 更 清楚 地 描述 映射 技术 )。 最 后 ， 假 设 高 速 缓 存在 块 替换 时 使 用 
LRU 替 换算 法 。 

让 我 们 来 分 析 一 下 运行 下 面 程序 引起 的 数据 高 速 缓存 人 口 的 变化 ，A 是 4 x 10 的 数字 数组 ， 
每 个 元 素 占 一 个 字 ， 它 存储 在 单元 7A00 到 7A27 处 (16 进 制 )。A 数 组 的 元 素 按 列 顺序 存储 ， 如 图 
5-18 所 示 。 这 个 图 还 说 明了 不 同 高 速 缓存 映射 技术 的 标志 是 如 何 从 存储 地 址 中 得 到 的 。 注 意 这 
里 不 需要 像 图 5-15 到 图 5-17 那 样 用 一 些 位 来 标志 块 中 的 字 ， 因 为 我 们 已 经 假设 每 个 块 中 只 有 一 个 
字 。 程 序 用 A 的 行 元 素 的 平均 值 来 标准 化 第 一 行 元 素 。 因 此 ， 我 们 需要 计算 这 行 元 素 的 平均 值 ， 
然后 用 平均 值 去 除 每 个 元 素 。 需 要 的 任务 可 以 表示 为 : 
A(0, i) 


(57,40, pA ~ ' 


图 5-19 给 出 了 对 应 这 项 任务 的 程序 结构 。 在 这 个 程序 的 机 器 语言 实现 中 ， 数 组 元 素 被 编 址 成 存 
储 器 单元 。 我 们 使 用 变量 SUM 和 AVE 来 分 别 保存 总 数 和 平均 值 。 这 些 变量 ， 还 有 变 址 变量 i Mj, 
在 计算 时 都 被 保存 在 处 理 器 的 寄存 器 中 。 

直接 映射 高 速 缓存 

在 一 个 直接 映射 的 数据 高 速 缓存 中 ， 高 速 缓存 内 容 的 变化 如 图 5-20 所 示 。 表 的 各 列表 示 图 5- 
19 中 程序 的 两 个 循环 各 次 执行 完成 后 高 速 缓存 中 的 内 容 。 例 如 。 第 一 个 循环 执行 完 两 次 后 U= 1), 
高 速 缓存 中 保存 元 素 4 (0, 0 和 A (0, 1)。 这 些 元 素 在 块 的 0 和 4 单元 中 ， 由 地 址 的 最 低 3 位 决定 。 
在 下 次 循环 中 ， 元 素 4 (0, 0) 被 4 (0, 2) 替换 ，4 (0, 2) 也 被 映射 到 相同 的 位 置 。 注 意 ， 需 要 的 元 
素 只 被 映射 到 高 速 缓存 的 两 个 单元 中 ， 其 他 的 六 个 单元 无 论 在 执行 标准 化 任务 之 前 内 容 是 什么 ， 
都 保持 不 变 。 | 

第 一 个 循环 执行 十 次 后 0 = 9)， 高 速 缓存 中 的 内 容 是 4 (0, 8) 和 4 (0, 9) 。 由 于 第 二 个 循环 颠 
倒 了 元 素 的 处 理 顺 序 ， 头 两 次 循环 时 将 在 高 速 缓存 中 找到 需要 的 数据 。 当 i = 7 时 ，4 (0, 9) 被 4 
(0, 7) 替换 ; 当 i = 6 时 ，4 (0, 8) 被 4 (0, 6) 替换 ， 依 次 类 推 。 因 此 在 执行 第 二 个 循环 时 ， 八 个 元 
素 都 被 替换 了 。 


A(0, i- , 9 
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存储 器 地 址 内 容 
GAO) 0111101000000000 
QA) 0111101000000001 
GAO) 0111101000000010 
(A03) 0111101000000011 
(07A04) 0111101000000100 
CA24) 0111101000100100 
(A25) 0111101000100101 
(A26 0111101000100110 
GA?) |O0O1111010001000 l}l 





— 直接 映射 的 标志 | 
~ 一 一 组 相 联 映射 的 标志 一 一 ~ 
相 联 映 射 的 标志 


图 5-18 存储 在 主 存 中 的 一 个 数组 








SUM := 0 
for j:= O to 9 do 

SUM := SUM + A(0j) 
end 


AVE := SUM / 10 
for i:= 9 downto 0 do 
A(0,i) := A(0,i) / AVE 


end 





图 5-19 5.5.3 节 中 任务 的 示例 
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图 5-20 直接 映射 数据 高 速 缓存 的 内 容 


读者 应 该 记 住 为 高 速 缓存 中 的 每 个 块 保存 标志 ， 由 于 空间 的 因素 ， 我 们 没有 在 图 中 显示 它们 。 

相 联 映射 高 速 缓存 | 

图 5$-21 显 示 了 相 联 映射 高 速 缓存 时 的 变化 。 在 第 一 个 循环 的 头 八 次 循环 中 ， 假 设 高 速 缓存 
最 开始 是 空 的 ， 那 么 元 素 被 放 入 连续 单元 的 块 中 。 在 第 9 次 循环 中 ，LRU 算 法 选择 A (0, 0) 被 4 
(0, 8) 种 盖 。j 循环 的 下 一 次 ， 也 是 最 后 一 次 循环 中 4 (0, 1) 被 4 (0, 9) 替换 。 现 在 ,第 二 个 循环 
的 头 八 次 循环 (i=9, 8,…, 2) 都 只 需要 高 速 缓存 中 的 元 素 。 当 i= 1 时 ， 需 要 的 元 素 是 4 (0, 1) ， 所 
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以 它 替换 最 近 最 少 使 用 的 元 素 4 (0, 9) 。 在 最 后 一 次 循环 中 ，4 (0, 0) 替换 4 (0, 8) 。 
在 这 种 情况 下 ， 当 第 二 个 循环 执行 时 ， 只 有 两 
个 元 素 不 能 在 高 速 缓存 中 找到 。 在 直接 映射 的 情况 
中 ， 第 二 个 元 素 执行 期 间 有 八 个 元 素 需要 重新 装 入 。 
显然 ， 相 联 高 速 缓存 受益 于 可 以 完全 自由 地 把 主 存 
块 映射 到 高 速 缓存 中 的 任何 位 置 。 高 速 缓存 的 这 种 
良好 应 用 还 因为 在 程序 的 第 二 个 循环 中 我 们 选择 逆 
序 处 理 元 素 。 如 果 第 二 个 循环 处 理 元 素 的 顺序 与 第 
一 个 循环 一 样 的 话 将 会 怎样 呢 ? 考虑 这 个 问题 很 有 
意思 。 使 用 LRU 算 法 ， 在 第 二 个 循环 中 ， 所 有 元 素 
在 使 用 前 都 会 被 覆盖 。 如 果 使 用 随机 替换 算法 ， 性 L AG. 
能 的 退化 就 不 会 发 生 。 图 5-21 ANSERA DNE 
组 相 联 映射 高 速 缓 存 
在 这 个 例子 中 ， 假 设 组 相 联 数据 高 速 缓存 组 织 成 两 个 组 ， 每 组 能 保存 四 个 块 。 这 样 ， 地 址 
的 最 低位 决定 相应 的 存储 器 块 映射 到 哪个 组 中 ， o _ 
高 15 位 组 成 标志 。 u 和 次 条 后记 级 和 中 的 内 容 ú 
图 5-22 描 述 了 高 速 缓 存 内 容 的 变化 。 因 为 一 
所 有 的 块 都 是 偶数 的 地 址 ， 它 们 映射 到 第 0 组 。 
注意 在 这 种 情况 下 ， 在 第 二 个 循环 执行 期 间 ， 
有 六 个 元 素 必 须 被 重新 装 入 。 I 
虽然 这 是 一 个 简单 的 例子 ， 但 是 它 说 明了 1 AG AG.) AG). AG) A03), 
一 般 情况 下 ， 相 联 映 射 性 能 最 好 ， 组 相 联 映 射 
次 之 ， 直 接 映射 最 差 。 但 是 相 联 映射 实现 代价 — O | 
太 高 ， 所 以 组 相 联 映射 是 一 种 很 好 的 折 中 实用 — 
DE. 图 5-22 组 相 联 映射 数据 高 速 缓存 的 内 容 


每 次 循环 后 数据 高 速 组 存 中 的 内 容 





yAn + UN- ° 
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5.5.4 商用 处 理 器 中 高 速 组 存 的 例子 


我 们 现在 来 考虑 在 68040、ARM710T Pentium HG 和 Pentium 4 处 理 器 中 高 速 缓存 的 实现 。 

68040 高 速 缓存 

Motorola 68040 在 处 理 器 芯片 上 包含 两 个 高 速 缓存 ， 一 个 用 于 指令 ， 另 一 个 用 于 数据 。 每 个 
高 速 缓存 有 4K 字 节 的 容量 ， 使 用 图 5-23 描 述 的 4 路 组 相 联结 构 。 这 个 高 速 缓存 有 64 个 组 ， 每 个 组 
能 保存 4 个 块 。 每 个 块 有 4 个 长 字 ， 每 个 长 字 有 4 个 字 节 。 为 了 映射 的 目的 ， 地 址 按照 图 中 所 示 的 
那样 进行 解释 。 最 低 的 4 位 指定 块 中 一 个 字 节 的 位 置 ， 下 面 的 6 位 在 64 个 组 中 确定 一 个 组 ， 高 22 
位 组 成 标志 。 为 了 压缩 图 中 的 符号 表示 ， 每 个 字段 中 的 内 容 用 16 进 制 显示 。 

高 速 缓存 控 制 机 制 中 包括 每 块 有 一 个 有 效 位 以 及 块 中 的 每 个 长 字 脏 位 ， 这 些 位 已 在 5.5.1 节 
中 解释 过 。 当 一 个 对 应 的 块 第 一 次 被 装 和 高速 缓存 时 ， 它 的 有 效 位 设 成 1。 每 个 长 字 都 有 一 个 单 
独 的 脏 位 与 之 相 联 ， 在 写 操作 期 间 ， 如 果 这 个 长 字 的 数据 发 生 改变 ， 那么 它 的 脏 位 设 成 1。 这 个 
脏 位 保持 这 个 设置 ， 直 到 这 块 的 内 容 被 写 回 到 主 存 中 。 

当 高 速 缓存 被 访问 时 ， 地 址 的 标志 位 与 指定 组 的 四 位 标志 做 比较 。 如 果 有 一 个 标志 与 期 望 
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的 地 址 匹配 ， 并 且 相 应 块 的 有 效 位 等 于 1， 那 么 就 命中 了 。 图 5-23 给 出 了 一 个 例子 ， 在 该 例 中 被 
寻 址 的 数据 在 第 0 组 第 4 块 的 第 3 个 长 字 中 找到 。 

数据 高 速 缓存 可 以 在 操作 系统 的 控制 下 ， 使 用 直接 写 或 写 回 协议 中 的 任何 一 种 。 指 令 高 速 
缓存 的 内 容 只 有 在 读 和 失效 后 装 和 人 新 指令 时 才 会 改变 。 当 一 个 新 块 必须 装 人 一 个 已 经 满 了 的 高 速 
缓存 组 中 时 ， 替 换算 法 随机 选择 被 换 出 的 块 。 当 然 ， 如 果 块 中 的 一 个 或 多 个 脏 位 等 于 1， 那 么 必 
须 首先 执行 写 回 操作 。 


22 位 6 位 4 位 
地 址 0000 0000 0010 1111 1100 1000 0000 1000 


F 一 一 


| sr? [oo Ts] 











第 63 组 





图 5-23 68040 微 处 理 器 的 数据 高 速 缓存 结构 


ARM710T 高 速 缓存 
ARM 系 列 是 由 具有 有 效 的 RISC 型 体系 结构 ， 且 具有 低 成 本 和 低能 耗 特征 的 处 理 器 组 成 。 
ARM710T 是 这 个 系列 处 理 器 中 的 一 员 。 它 只 有 一 个 高 速 缓存 ， 同 时 用 于 指令 和 数据 处 理 。 
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ARM710T 高 速 缓存 的 组 织 结构 与 图 5-23 描 述 的 高 速 缓存 类 似 ， 它 被 排 成 4 路 组 相 联 缓存 。 每 
个 块 包括 16 个 字 节 ， 组 成 四 个 32 位 的 字 。 

当 处 理 器 向 高 速 缓存 中 写 时 ， 使 用 直接 写 协 议 。 当 新 块 需要 空间 时 ， 使 用 随机 替换 算法 决 
定 哪 一 个 高 速 缓存 块 被 覆盖 。 

ARM710T 高 速 缓存 的 结构 与 低 成 本 、 低 能 耗 的 目标 一 致 。 一 个 单独 统一 的 高 速 缓存 同时 保 
存 指令 和 数据 ， 这 上 比 使 用 两 个 单独 的 高 速 缓存 简单 。 直 接 写 协 议和 随机 替换 算法 也 有 助 于 实现 
的 简单 化 。 

Pentium IE RETF 

Pentium II 是 高 性 能 处 理 器 。 因 为 高 性 能 依赖 于 高 速 访问 指令 和 数据 ， 所 以 Pentium III 使 用 
了 二 级 高 速 缓存 。 第 一 级 由 一 个 16K 字 节 的 指令 缓存 和 一 个 16K 字 节 的 数据 缓存 组 成 。 数 据 缓存 
具有 4 路 组 相 联结 构 ， 它 既 可 以 使 用 写 回 策略 ， 也 可 以 使 用 直接 写 策略 。 指 令 缓存 具有 2 路 组 相 
联结 构 。 由 于 正常 情况 下 在 程序 执行 期 间 指 令 不 会 被 修改 ， 所 以 指令 高 速 缓存 不 需要 写 策略 。 

第 二 级 高 速 缓存 要 大 得 多 ， 它 既 保存 指令 ， 又 保存 数据 。 像 图 5-24 中 给 出 的 那样 ， 二 级 高 
速 缓存 连接 到 系统 的 其 余部 分 。 一 个 总 线 接口 部 件 把 高 速 缓 存 、 主 存 和 IO 设备 连接 起 来 。 这 里 
使 用 两 个 单独 的 总 线 : 快速 的 高 速 缓存 总 线 把 二 级 高 速 缓存 连接 到 处 理 器 ， 而 慢 一 些 的 系统 总 
线 用 于 连接 主 存 和 IO 设备 。 






总 线 接口 部 件 


高 速 缓存 总 线 系统 总 线 


IL2 高 速 缓存 


图 5-24 Pentium II 处 理 器 的 高 速 缓 存 和 外 部 连接 


一 级 高 速 缓存 可 以 在 处 理 器 芯片 外 部 实现 ， 就 像 在 Pentium 项 的 一 个 称 为 Katmai 的 版 本 中 所 
做 的 那样 。 在 这 种 情况 下 ， 高 速 缓存 包含 512K 字 节 ， 用 静态 随机 存储 器 实现 。 它 的 结构 是 4 路 组 
相 联 结构 ， 使 用 写 回 或 直接 写 协 议 ， 可 以 在 每 块 的 基础 上 编程 。 高 速 缓存 总 线 的 宽度 是 64 位 。 

VLSI 技 术 的 发 展 使 得 把 二 级 高 速 缓 存 集成 到 处 理 器 芯片 的 内 部 成 为 可 能 ， 这 已 经 在 Pentium 
I 的 Coppermine 版 本 上 实现 了 。 这 里 高 速 缓存 的 容量 是 256K 字 节 ， 它 使 用 8 路 组 相 联 结构 。 由 于 
二 级 高 速 缓存 在 处 理 器 芯片 上 ， 所 以 有 可 能 使 用 更 宽 的 256 位 高 速 缓存 总 线 。 

这 些 例子 提出 一 个 有 趣 的 问题 一 一 二 级 高 速 缓存 是 在 外 部 实现 好 还 是 在 处 理 器 芯片 内 部 实 





现 好 ? 外 部 实现 的 高 速 缓存 允许 更 大 的 容量 ， 但 是 它 不 便于 加 宽 到 处 理 器 的 数据 连接 通路 ， 因 
为 这 需要 额外 的 引 脚 ， 并 且 会 增加 输出 驱动 器 的 功 耗 。 此 外 ， 外 部 高 速 缓存 的 时 钟 速 度 比 较 慢 。 

Katmai 的 二 级 高 速 缓 存 按 处 理 器 时 钟 速度 的 一 半 驱 动 ， 而 Coppermine 的 二 级 高 速 缓存 以 处 理 器 
时 钟 的 全 速 驱 动 。 把 二 级 高 速 缓存 放 到 处 理 器 芯片 上 减少 了 访问 的 延迟 ， 增 加 了 带宽 。 因 为 数 
据 可 以 使 用 更 宽 的 通路 传输 ， 这 可 以 带 来 更 好 的 性 能 。 集 成 式 二 级 高 速 缓存 的 主要 缺点 是 处 理 
芯片 变 得 更 大 ， 使 得 它 更 加 难以 制造 。 

Pentium 4 高 速 缓存 

Pentium 4 处 理 器 可 以 有 多 达 三 级 的 高 速 缓存 。 一 级 高 速 缓存 包括 分 开 的 数据 缓存 和 指令 缓 
存 。 数 据 缓 存 容量 为 8K 字 节 ， 按 4 路 组 相 联 方法 组 织 。 每 个 缓存 块 有 64 个 字 节 。 向 这 个 缓存 中 写 
数据 时 使 用 直接 写 策 略 。 可 以 在 两 个 时 钟 周期 内 从 数据 缓存 中 访问 整数 数据 。Pentium 4 可 以 使 
用 超过 1.3GHz 的 时 钟 信号 ， 这 意味 着 数据 可 以 在 少 于 2ns 的 时 间 内 被 访问 。 指 令 缓存 并 不 保存 一 
般 的 机 器 指令 ， 而 是 保存 已 经 译 码 后 的 指令 ， 这 将 在 第 11 章 中 讨论 。 

二 级 高 速 缓 存 是 一 个 统一 的 高 速 缓存 ， 有 256K 字 车 的 容量 ， 按 8 路 组 相 联 方法 组 织 。 它 的 每 
个 块 包含 128 个 字 节 。 当 向 高 速 缓存 中 写 时 ， 使 用 写 回 策略 。 这 个 高 速 缓存 的 访问 延迟 是 7 个 时 
钟 周 期 。 

一 级 高 速 缓存 和 二 级 高 速 缓存 都 在 处 理 器 芯片 上 实现 ， 这 个 体系 结构 还 允许 包含 一 个 芯片 
内 的 三 级 高 速 缓存 。 但 是 ， 在 用 于 桌面 计算 机 的 Pentium 4 处 理 器 上 没有 实现 这 个 高 速 缓存 ， 这 
个 高 速 缓存 准备 用 在 服务 器 系统 的 处 理 器 芯片 上 。 


5.6 性 能 因素 


计算 机 在 商业 上 取得 成 功 的 两 个 关键 因素 是 性 能 和 成 本 ， 其 目标 是 以 最 低 的 成 本 获得 最 高 
的 性 能 。 在 设计 可 用 方案 时 的 挑战 是 在 不 增加 成 本 的 前 提 下 提高 性 能 。 衡 量 成 效 的 一 个 通用 标 
准 是 性 价 比 。 在 这 一 节 ， 我 们 讨论 一 些 存储 器 设计 的 特征 ， 它 们 能 得 到 很 好 的 性 能 。 

性 能 依赖 于 机 器 指令 能 以 多 快 的 速度 送 和 处理 器 ， 以 及 它们 能 以 多 快 的 速度 执行 。 我 们 将 
在 第 7 章 和 第 8 章 讨论 执行 速度 ， 展 示 如 何 使 用 附加 电路 在 执行 阶段 提高 指令 处 理 的 速度 。 在 这 
一 章 ， 我 们 把 重点 放 在 存储 器 子 系统 上 。 

在 5.4 节 描述 的 存储 器 层次 结构 源 自 于 对 更 好 性 价 比 的 探索 ， 这 个 层次 结构 的 主要 目的 是 创 
建 一 个 从 处 理 器 角度 来 看 有 短 访问 时 间 和 大 容量 的 存储 器 。 层 次 结构 的 每 一 层 都 扮演 一 个 重要 
的 角色 ， 在 不 同 层 之 间 的 数据 传输 速度 和 效率 也 是 非常 重要 的 。 在 向 或 从 快速 部 件 中 传输 数据 
时 ， 能 以 与 该 快 速 部 件 同 等 的 速率 进行 是 很 有 用 的 。 如 果 慢 速 部 件 和 快速 部 件 使 用 同样 的 方式 
访问 ， 实 现 相同 访问 速度 是 不 可 能 的 ， 但 是 如 果 慢 速 部 件 的 组 织 结构 中 使 用 了 并 行 机 制 的 话 ， 
我 们 就 可 以 实现 这 一 点 。 引 入 并 行 机 制 的 有 效 办 法 是 使 用 交叉 结构 。 


5.6.1 交叉 


如 果 计 算 机 的 主 存 构造 成 为 物理 上 分 开 的 模块 ， 每 个 模块 都 有 它 自己 的 地 址 给 冲 寄 存 器 
(ABR) 和 数据 缓冲 等 存 器 (DBR)， 那 么 存储 器 访问 操作 可 以 同时 在 多 个 模块 中 进行 。 这 样 ， 
从 或 向 主 存 系统 传输 多 个 字 的 总 体 速 率 就 会 提高 。 

在 确定 计算 处 理 过 程 中 能 保持 在 工作 状态 的 模块 平均 数 时 ， 如 何 把 单独 的 地 址 分 布 在 模块 上 
是 关键 的 。 图 5-25 给 出 了 两 种 地 址 布局 的 方法 。 在 第 一 种 情况 中 ， 由 处 理 器 产生 的 地 址 按 图 5-25a 
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所 示 的 方式 进行 译 码 。 高 位 指定 个 模块 中 的 一 个 模块 , 低 m 位 指定 在 这 个 模块 中 的 一 个 字 节 。 
在 访问 连续 单元 时 , 例如 把 一 块 数据 传输 到 高 速 缓存 中 时 , 就 只 需要 访问 一 个 模块 。 而 与 此 同时 ， 
有 直接 存储 器 访问 (DMA) 能 力 的 设备 可 以 访问 另 一 个 模块 中 的 信息 。 


~ kii —— a mm 位 一 


模块 内 地 址 | MM 地 址 





a) 连续 字 在 一 个 模块 中 


— mË — k = 


模块 内 地 址 MM 地 址 





b) 连续 字 在 连续 模块 中 
图 5-25 在 多 模块 存储 器 系统 中 寻 址 


第 二 个 也 是 效率 更 高 的 模块 编 址 方法 在 图 $-25Sb 中 给 出 ， 它 称 为 存储 器 交叉 。 存 储 器 地 址 的 
低 k 位 选择 一 个 模块 ， 而 高 m 位 指定 在 该 模块 中 的 一 个 单元 。 在 这 种 方法 中 ， 连 续 的 地 址 被 放 
在 相继 的 模块 中 。 这 样 ， 生 成 访问 连续 内 存单 元 请 求 的 任何 系统 部 件 都 能 使 多 个 模块 同时 处 于 
工作 状态 ， 它 可 以 在 总 体 上 加 快 块 数据 的 访问 ， 提 高 存储 器 系统 的 平均 利用 率 。 为 了 实现 交叉 
结构 ， 必 须 有 2 个 模块 ， 否 则 在 地 址 空间 中 会 有 不 存在 的 单元 ， 出 现 空 阶 。 


例 5.1 ”交叉 具有 非常 好 的 效果 。 考 虑 在 读 失效 发 生 时 从 主 存储 器 向 高 速 缓存 传输 一 块 数据 
需要 的 时 间 。 假 设 使 用 每 块 8 个 字 的 高 速 缓存 ， 就 像 我 们 在 5.5 节 中 给 出 的 举例 那样 。 读 失效 时 ， 
包含 需要 字 的 块 必须 从 主 存 中 拷贝 到 高 速 缓存 中 。 假 设 硬件 有 以 下 属性 ， 它 把 地 址 送 到 主 存储 
器 要 用 一 个 时 钟 周 期 ， 主 存储 器 使 用 相对 较 慢 的 DRAM 芯 片 构建 ， 人 允许 在 8 个 时 钟 周期 内 访问 第 
一 个 字 ， 但 是 块 中 后 续 字 的 每 个 字 花 费 4 个 周期 (回想 5.2.3 节 ， 在 DRAM 中 ， 当 从 一 个 给 定 行 读 
取 连 续 的 单元 时 ， 行 地 址 只 需 译 码 一 次 。 然 后 使 用 阵列 的 连续 列 地 址 去 访问 需要 的 字 ， 这 时 每 
次 访问 只 需 一 半 的 时 间 )。 此 外 ， 送 一 个 字 到 高 速 缓存 需要 1 个 时 钟 周 期 。 

在 使 用 单一 存储 器 模块 时 ， 将 所 需要 的 块 装载 到 高 速 缓 在 中 需要 的 时 间 是 
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1+8+(7x4)+1=38 周期 


现在 假设 存储 器 由 四 个 交叉 模块 构成 ， 使 用 图 5-25b 中 描述 的 方案 。 当 块 的 起 始 地 址 到 达 存 储 器 
时 ， 所 有 的 四 个 模块 都 开始 使 用 高 位 地 址 来 访问 需要 的 数据 。8 个 时 钟 周 期 后 ， 每 个 模块 把 一 个 
字 的 数据 放 到 它 的 DBR 中 。 在 接 下 来 的 4 个 时 钟 周期 中 ， 这 些 数据 被 传输 到 高 速 缓存 中 ， 每 次 一 
个 字 。 在 这 段 时 间 内 ， 每 个 模块 的 下 一 个 字 被 访问 ， 然 后 它 再 花费 4 个 时 钟 周期 把 这 些 字 传 输 到 
高 速 缓存 中 。 因 此 ， 从 交叉 存储 器 中 装 入 块 需要 的 时 间 是 

1+8+4+4=17 有 周期 


因而 ， 交 叉 使 得 块 传输 时 间 减 少 了 一 半 。 


在 5.2.4 节 中 ， 我 们 提 到 把 交叉 用 于 SDRAM 芯 片 来 提高 访问 连续 字 的 速度 。 在 大 多 数 
SDRAM 攻 片 中 存储 阵列 由 两 个 或 四 个 更 小 的 交叉 阵列 存储 器 构成 ， 这 样 提 高 了 向 或 从 主 存 中 传 
输 一 块 数据 时 的 速率 。 


562 命中 率 和 失效 开销 


衡量 存储 器 体系 结构 的 具体 实现 效率 的 一 个 很 好 指标 是 在 这 个 层次 结构 的 各 个 层 上 访问 信 
息 的 成 功率 。 前 面 提 到 在 高 速 缓存 中 一 次 成 功 的 数据 访问 称 为 命中 。 命 中 次 数 比 上 访问 总 次 数 
称 为 命中 率 ， 而 失效 次 数 比 上 访问 总 次 数 称 为 失效 率 。 

理想 情况 下 ， 整 个 存储 器 层次 结构 对 于 处 理 器 来 说 表现 得 就 像 一 个 单独 的 存储 器 部 件 那样 ， 
具有 处 理 器 芯片 上 的 高 速 缓存 的 访问 速度 ， 还 具有 磁盘 的 容量 。 我 们 距离 这 个 理想 目标 有 多 远 ， 
很 大 程度 上 取决 于 层次 结构 上 不 同 以 的 命中 率 。 超 过 0.9 的 高 命中 率 对 于 高 性 能 计算 机 来 说 是 必 
需 的 。 

失效 发 生 后 采取 的 必要 措施 会 对 性 能 产生 影响 。 把 所 需 信 息 放 人 高 速 缓存 所 需要 的 额外 时 
间 称 为 失效 开销 ， 这 个 开销 最 终 反映 在 处 理 器 等 待 的 时 间 上 ， 因 为 执行 所 需要 的 指令 或 数据 不 
能 获得 。 一 般 说 来 ， 失 效 开销 是 把 数据 块 从 层次 结构 中 的 慢 速 部 件 传输 到 快速 部 件 所 需 的 时 间 。 
如 果实 现 了 在 层次 结构 中 不 同 部 件 之 间 传 输 数 据 的 有 效 机 制 的 话 ， 失 效 开销 会 降低 。 前面 一 节 
描述 了 交 又 存储 器 是 如 何 有 效 地 降低 失效 开销 问题 的 。 


例 5.2 ”现在 考虑 高 速 缓存 对 计算 机 总 体 性 能 的 影响 。 令 h 表示 命中 率 ，M 表示 失效 开销 ， 
即 访问 主 存 信息 需要 的 时 间 ，C 表示 访问 高 速 缓 存 信息 需要 的 时 间 。 处 理 器 的 平均 访问 时 间 是 
L= hC+(1-h)M 
我 们 使 用 例 5.1 中 使 用 的 参数 。 如 果 计 算 机 没有 高 速 缓存 ， 那 么 使 用 快速 处 理 器 和 典型 DRAM 主 
存 时 ， 每 个 存储 器 读 访 问 花费 10 个 时 钟 周 期 。 假 设计 算 机 有 一 个 每 块 8 个 字 的 高 速 缓存 ， 并 且 有 
一 个 交叉 主 存 ， 那 么 就 像 在 5.6.1 节 中 所 示 的 那样 ， 装载 一 个 块 到 主 存 需要 17 个 时 钟 周 期 。 假 设 
在 具有 代表 性 的 程序 中 30% 的 指令 需要 执行 读 写 操作 ， 这 意味 着 每 执行 100 条 指令 会 有 130 次 存 
储 器 访问 。 假 设 高 速 缓存 命中 率 对 于 指令 是 0.95， 对 于 数据 是 0.9， 我 们 再 进一步 假设 读 写 操作 
的 失效 开销 是 相等 的 ， 那 么 使 用 高 速 缓存 带 来 的 性 能 提高 可 以 按 下 面 公式 粗略 估算 ; 
无 高 速 缓存 时 的 时 间 _ 130 x 10 _ 
有 高 速 缓存 时 的 时 间 — 100 (0.95 x 1+ 0.05x 17)+30(0.9x1+0.1x17) > 
这 个 结果 表明 使 用 高 速 缓存 的 计算 机 性 能 要 比 原 来 好 五 倍 。 
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钟 周 期 ) 的 相 比 效 果 也 是 很 有 趣 的 。 我 们 对 这 些 高 速 缓存 相对 性 能 的 粗略 估算 如 下 


100 (0.95 x 1 +0.05 x 17) + 30 (0.9 x 1 + 0.1 x 17) - 
130 


这 表明 处 理 器 在 高 速 缓存 实际 提供 的 环境 中 有 效 地 工作 在 基于 DRAM 的 主 存 中 ， 而 主 存 表现 出 
来 的 速度 只 比 高 速 缓存 电路 慢 两 倍 。 

在 这 个 例子 中 我 们 做 了 一 个 简化 的 假设 ， 那 就 是 访问 世 片 内 的 高 速 缓存 与 通过 系统 总 线 访 
问 主 存 使 用 相同 的 时 钟 周期 。 一 个 高 性 能 处 理 器 在 比 系统 总 线 时 钟 快 得 多 的 时 钟 控 制 下 运行 ， 
可 能 会 快 十 倍 。 让 我 们 来 考虑 在 这 种 类 型 系统 中 高 速 缓存 的 影响 。 
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例 5.3 假设 在 处 理 器 芯片 上 实现 了 一 个 单独 的 高 速 缓存 ， 主 存 用 SDRAM 芯 片 实现 。 假 设 系 
统 总 线 时 钟 比 处 理 器 时 钟 慢 四 倍 。 与 例 5.2 一 样 ， 我 们 也 假设 高 速 缓存 每 块 有 8 个 字 ， 并 且 高 速 组 
存 命中 率 对 于 指令 是 0.95， 对 于 数据 是 0.9。SDRAM 的 时 序 图 与 图 $-9 相 似 。 惟 一 的 区 别 是 使 用 8 
个 字 的 脉冲 操作 ， 而 不 是 4 个 字 。 于 是 根据 图 $-9?， 从 RAS 信 号 声明 在 主 存 和 高 速 缓 存 之 间 传输 
一 块 数据 开始 到 结束 要 耗费 14 个 时 钟 周期 。 由 于 RAS 和 CAS 信 号 就 像 图 5-11 所 示 的 那样 由 存储 器 
控制 器 产生 ， 所 以 处 理 器 把 数据 块 的 第 一 个 字 的 地 址 送 到 存储 器 控制 器 中 还 需要 1 个 时 钟 周 期 。 
因此 传输 一 个 块 总 共 需 要 15 个 时 钟 周期 。 图 5-9 中 所 示 的 周期 是 系统 总 线 时 钟 周 期 。 如 果 处 理 器 
时 钟 要 快 四 倍 ， 那 么 需要 60 个 处 理 器 时 钟 周期 来 向 或 从 主 存 中 传输 一 个 8 个 字 的 块 。 还 要 注意 图 
5-9 表 明 处 理 器 可 以 在 9 个 总 线 时钟 周 期 内 在 主 存 中 读 写 一 个 字 ， 这 包括 图 5-9 所 示 的 8 个 周期 再 加 
上 向 存储 器 发 送 地 址 需要 的 1 个 周期 。 因 此 ， 访 问 主 存 中 的 一 个 字 需 要 36 个 处 理 器 时 钟 周 期 。 然 
而 ， 处 理 器 可 以 在 1 个 处 理 器 周期 内 访问 高 速 缓 存 中 的 一 个 字 。 

重复 例 5.2 中 的 计算 可 以 得 出 : 

无 高 速 缓存 时 的 时 间 _ 130 x 36 _ 
有 高 速 缓存 时 的 时 间 — 100 (0.95 x 1 + 0.05 x 60) + 30 (0.9 x 1 + 0.1 x 60) 
因而 ， 考 虑 处 理 器 与 系统 总 线 时 钟 速 度 的 区 别 后 表明 高 速 缓存 对 性 能 有 更 大 的 正面 作用 。 


前 面 的 例子 中 ， 在 考虑 命中 率 时 我 们 把 指令 和 数据 区 分 开 来 。 虽 然 它 们 的 命中 率 都 超过 0.9， 
但 是 指令 命中 率 一 般 比 数据 命中 率 要 高 。 命 中 率 依赖 于 高 速 缓存 的 设计 和 所 执行 程序 的 指令 和 
数据 的 访问 模式 。 

如 何 才能 提高 命中 率 呢 ? 一 个 明显 的 可 能 性 是 使 用 更 大 的 高 速 缓存 ， 但 是 这 必定 要 增加 成 
本 。 另 一 个 可 能 性 是 在 保持 高 速 缓存 总 容量 不 变 的 前 提 下 增加 块 的 大 小 ， 以 发 挥 局 部 空间 的 优 
势 。 如 果 在 一 个 较 大 的 块 中 所 有 的 项 数 都 是 计算 中 所 需 的 ， 那 么 最 好 是 在 一 次 失效 后 将 所 有 这 
些 项 都 装 入 高速 缓存 ， 而 不 是 在 多 次 失效 后 分 别 装 入 ， 每 次 只 装 和 人 一 个 较 小 的 块 。 对 交叉 主 存 
块 的 并 行 访问 效率 是 获得 这 个 优势 的 基本 前 提 。 在 达到 一 定 大 小 之 前 ， 增 大 块 的 大 小 是 有 效 的 ， 
但 是 对 命中 率 的 进一步 提高 最 终 会 被 抵消 掉 ， 因 为 在 更 大 的 块 中 ， 有 些 项 还 是 没有 被 访问 ， 该 
块 就 已 经 被 换 出 了 。 随 着 块 大 小 的 增加 ， 失 效 开销 也 会 加 大 。 由 于 计算 机 性 能 受命 中 率 增加 的 
正面 影响 ， 还 受 失效 开销 增加 的 负面 影响 ， 因 此 块 大 小 适中 时 可 以 获得 最 佳 效 果 。 在 实际 中 ， 
最 常用 的 块 大 小 范围 是 16 字 节 到 128 字 节 。 

最 后 ， 我 们 注意 到 如 果 在 新 块 装 入 高 速 缓存 时 使 用 直接 装 入 法 ， 那 么 失效 开销 可 以 降低 。 
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这 样 ， 处 理 器 在 所 需要 的 字 一 旦 被 装 人 高 速 缓存 后 就 可 以 继续 工作 ， 而 不 是 必须 等 待 传输 完成 。 
5.6.3 处 理 器 芯片 上 的 高 速 缓存 


当 信 息 在 不 同 的 蕊 片 间 传输 时 ， 蕊 片上 的 驱动 器 和 接收 器 会 产生 不 可 忽略 的 延迟 。 所 以 从 
速度 的 角度 考虑 ， 放 置 高 速 缓存 的 最 佳 位 置 是 在 处 理 器 芯片 上 。 但 不 幸 的 是 ， 处 理 器 芯片 上 的 
空间 还 需要 用 于 很 多 其 他 的 功能 ， 这 限制 了 能 放下 的 高 速 缓存 的 容量 。 

所 有 高 性 能 处 理 器 芯片 都 包含 某 种 形式 的 高 速 缓 存 。 一 些 制 造 商 选择 实现 两 个 独立 的 高 速 
缓存 ， 一 个 用 于 指令 ， 另 一 个 用 于 数据 ， 如 68040、Pentium II#IPentium 4 处 理 器 。 其 他 的 只 实 
现 一 个 单一 的 高 速 缓存 ， 既 用 于 指令 又 用 于 数据 ， 如 ARM710T 处 理 器 。 

指令 与 数据 混合 的 高 速 缓存 在 一 定 程度 上 可 能 有 更 高 的 命中 率 ， 因 为 在 把 新 信息 映射 到 高 
速 缓 在 中 时 它 提 供 了 更 大 的 灵活 性 。 但 是 ， 如 果 使 用 分 开 的 高 速 缓存 ， 就 可 以 同时 访问 两 个 高 
速 缓存 ， 这 增加 了 并 发 性 ， 带 来 更 好 的 性 能 。 分 离 高 速 缓存 的 缺点 是 为 了 增加 并 发 性 需要 更 复 
杂 的 电路 。 

在 高 性 能 处 理 器 中 通常 使 用 二 级 高 速 缓存 。 一 级 高 速 缓存 在 处 理 器 芯片 上 ， 而 二 级 高 速 组 
存 要 大 得 多 ， 可 以 用 SRAM 芯 片 在 外 部 实现 。 但 是 也 可 以 在 处 理 器 芯片 上 实现 一 个 稍微 小 一 些 
的 二 级 高 速 缓存 ， 如 同 在 5.5.4 节 中 描述 的 Coppermine 版 本 的 Pentium II 处 理 器 那样 。 

如 果 同 时 使 用 了 一 级 高 速 缓存 和 二 级 高 速 缓存 ， 那 么 应 该 把 一 级 高 速 缓存 设计 成 允许 处 理 
器 使 用 非常 快 的 速度 访问 ， 因 为 它 的 访问 速度 对 处 理 器 的 时 钟 速率 有 很 大 影响 。 访 问 高 速 缓存 
的 速度 不 可 能 与 访问 寄存 器 相同 ， 因 为 高 速 缓存 要 大 得 多 ， 因 而 它 更 复杂 。 加 快 访问 高 速 缓存 
速度 的 一 个 实用 方法 是 同时 访问 多 个 字 ， 然 后 让 处 理 器 使 用 这 些 字 ， 每 次 一 个 。 这 项 技术 在 很 
多 商业 处 理 器 上 被 应 用 。 

二 级 高 速 缓存 可 以 慢 一 些 ， 但 是 它 应 该 比 一 级 高 速 缓 存 大 得 多 ， 以 保证 高 命中 率 。 速 度 不 
是 那么 关键 ， 因 为 这 只 影响 一 级 高 速 缓存 的 失效 开销 。 用 作 工 作 站 的 计算 机 可 能 有 一 个 容量 为 
数 十 K 字 节 的 一 级 高 速 缓存 和 数 兆 字 节 的 二 级 高 速 缓存 。 

二 级 高 速 缓 存 进 一 步 减 小 了 主 存 速度 对 计算 机 性 能 的 影响 。 在 有 二 级 高 速 缓 存 的 系统 中 ， 
处 理 器 平均 访问 时 间 是 

tae = hiCi + (1 — hi) h>xC;+ (1 hi) (1 — h>) M 
其 中 ， 

hi 是 一 级 高 速 缓存 的 命中 率 ; 

ha 是 二 级 高 速 缓 存 的 命中 率 ; 

Ci 是 一 级 高 速 缓存 的 信息 访问 时 间 ; 

C2 是 二 级 高 速 缓 存 的 信息 访问 时 间 ; 

M 是 主 存 的 信息 访问 时 间 。 

二 级 高 速 缓存 的 失效 次 数 由 (1 - 如 ) (1 — h) 项 给 出 ， 它 应 该 很 低 。 如 果 和 如 都 是 在 高 于 90% 
这 个 范围 内 ， 那 么 失效 次 数 将 小 于 处 理 器 内 存 访 问 次 数 的 1% 。 那 么 ， 从 性 能 的 角度 看 ， 失 效 开 
销 M 的 重要 性 就 小 一 些 。 参 见习 题 5.18 对 这 个 问题 的 定量 分 析 。 


5.6.4 其 他 改进 
除了 刚才 讨论 的 主要 设计 问题 ， 还 存在 其 他 几 种 改进 性 能 的 可 能 性 。 在 这 一 节 我 们 讨论 其 
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中 三 种 。 

写 缓冲 区 

当 使 用 直接 写 协 议 时 ， 每 个 写 操作 导致 一 个 新 数据 被 写 人 主 存 。 如 果 处 理 器 必须 等 待 存储 
器 功能 完成 ， 像 我 们 之 前 假设 的 那样 ， 那 么 所 有 的 写 请 求 导 致 处 理 器 变 慢 。 但 是 处 理 器 通常 并 
不 直接 依赖 于 写 操作 的 结果 ， 所 以 它 不 必 等 待 写 请 求 的 完成 。 为 了 提高 性 能 ， 可 以 引入 一 个 写 
缓冲 区 来 临时 保存 写 请 求 。 处 理 器 把 每 个 写 请 求 放 到 这 个 缓冲 区 中 ， 然 后 继续 执行 后 面 的 指令 。 
当 存 储 器 没有 可 响应 的 读 请 求 时 ， 就 把 保存 在 缓冲 区 中 的 写 请 求 发 给 主 存 。 注 意 ， 立 即 满 足 读 
请 求 是 很 重要 的 ， 因 为 如 果 没 有 从 存储 器 中 读 取 的 数据 ， 处 理 器 通常 就 不 能 继续 执行 。 因 此 ， 
这 些 请 求 的 优先 级 比 写 请 求 高 。 

写 缓冲 区 可 以 保存 一 定数 量 的 写 请 求 ， 因 此 ， 后 面 的 读 请 求 引用 的 数据 可 能 仍 在 写 缓冲 区 
中 。 为 了 保证 正确 的 操作 ， 从 存储 器 中 读 取 的 数据 地 址 要 与 写 缓冲 区 中 数据 的 地 址 做 比较 ， 如 
果 匹 配 ， 那 么 写 缓冲 区 中 的 数据 就 是 可 用 的 。 ' 

如 果 使 用 写 回 协议 ， 那 么 就 会 有 不 同 的 情形 。 这 时 ， 写 操作 只 是 简单 地 对 高 速 缓存 中 相应 
的 字 进 行 写 。 读 失效 导致 新 数据 块 被 放 人 高 速 缓存 ， 这 会 替换 出 一 个 已 存在 的 包含 一 些 脏 数 据 
的 块 。 考 虑 一 下 这 时 会 发 生 什 么 ， 脏 块 必须 被 写 到 主 存 中 。 如 果 先 执行 所 需 的 写 回 操作 ， 那 么 
处 理 器 必须 等 待 很 长 时 间 ， 等 待 把 新 块 读 人 高 速 缓 存 。 因 此 首先 读 人 新 块 是 更 合理 的 。 可 以 设 
计 成 在 读 取 新 块 时 提供 一 个 快速 的 写 缓冲 区 ， 用 来 临时 存储 从 高 速 缓存 中 换 出 的 脏 块 ， 然 后 把 
缓冲 区 中 的 内 容 写 进 主 存 。 因 而 ， 写 缓冲 区 对 于 写 回 协议 也 是 有 效 的 。 

预 取 

在 前 面 讨论 的 高 速 缓存 机 制 中 ， 我 们 假设 新 数据 在 第 一 次 需要 时 被 装 入 高速 缓存 。 一 个 读 
失效 发 生 ， 然 后 需要 的 数据 从 主 存 装 人 ， 处 理 器 必须 暂停 ， 直 到 新 数据 到 达 ， 这 就 是 失效 开销 
的 影响 。 

为 了 避免 处 理 器 停止 ， 可 以 在 需要 数据 之 前 把 它们 预 取 到 高 速 缓 存 中 。 实 现 这 一 点 的 最 简 
单方 法 是 使 用 软件 。 处 理 器 的 指令 集 可 能 提供 一 个 特殊 的 预 取 指 令 。 执 行 这 个 指令 使 得 地 址 指 
向 的 数据 被 装 入 高 速 缓存 ， 就 像 读 失效 时 的 情况 一 样 。 然 而 ， 处 理 器 并 不 等 待 引用 的 数据 。 在 
程序 中 插入 预 取 指 令 ， 使 得 数据 在 程序 需要 时 已 经 被 装 入 到 了 高 速 缓存 中 。 最 好 在 处 理 器 执行 
不 会 引发 读 失效 指令 时 开始 预 取 ， 这 样 主 存 访问 就 能 与 处 理 器 运算 重 又 。 

预 取 指令 可 以 由 程序 员 或 编译 器 插入 。 显 然 让 编译 器 插入 这 些 指令 更 好 ， 对 很 多 应 用 程序 
来 说 它 可 以 做 得 很 成 功 。 注 意 软件 预 取 肯 定 有 一 定 的 开销 ， 因 为 包含 预 取 指 令 会 增加 程序 的 长 
度 。 此 外 ， 一 些 预 取 操作 可 能 会 把 那些 后 续 指 令 不 用 的 数据 装 入 高 速 缓 存 。 如 果 其 他 数据 引发 
的 读 失效 把 已 预 取 的 数据 从 高 速 缓存 中 换 出 ， 这 种 情况 就 会 发 生 。 但 是 ， 软 件 预 取 对 性 能 的 总 
体 效果 还 是 有 利 的 ， 并 且 已 有 支持 这 个 特性 的 机 器 指令 存在 。 关 于 软件 预 取 的 全 面 讨论 见 参考 
文献 []]。 

预 取 也 能 通过 硬件 实现 ， 这 需要 增加 用 于 发 现存 储 器 引用 模式 并 根据 这 个 模式 预 取 数据 的 
电路 。 为 了 这 个 目标 已 经 提出 了 很 多 方案 ， 它 们 超出 了 本 书 的 范围 。 对 这 些 方案 的 描述 可 以 在 
参考 文献 [2] 和 参考 文献 [3] 中 找到 。 

Intel 的 Pentium 4 处 理 器 具有 把 信息 预 取 到 高 速 缓存 的 装置 ， 它 同时 使 用 了 软件 和 硬件 的 方 
法 。 程 序 中 可 以 包含 特殊 的 预 取 指 令 ， 把 数据 块 放 入 所 需 级 别 的 高 速 缓存 中 。 硬 件 控 制 的 预 取 
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功能 根据 以 前 的 模式 把 需要 的 块 放 入 二 级 高 速 缓存 中 。 

无 锁定 高 速 缓存 

如 果 上 面 讨论 的 软件 预 取 方案 对 指令 的 正常 执行 产生 很 大 干扰 的 话 ， 就 不 会 产生 好 的 效果 。 
如 果 预 取 操作 在 预 取 完 成 前 阻止 其 他 对 高 速 缓存 的 访问 时 就 会 出 现 这 样 的 情况 。 这 种 类 型 的 高 
速 缓存 在 它 响应 一 次 失效 时 ， 我 们 称 它 为 被 锁定 了 。 可 以 通过 修改 高 速 缓存 的 基本 结构 来 解决 
这 个 问题 ， 允 许 处 理 器 在 高 速 缓 存 上 响 应 一 次 失效 时 仍 能 访问 它 。 实 际 上 ， 我 们 希望 能 支持 多 个 
未 响应 的 失效 。 

能 支持 多 个 未 响应 失效 的 高 速 缓存 称 为 无 锁定 高 速 缓 在。 因为 一 次 只 能 响应 一 个 失效 ， 因 
此 必须 引入 用 于 跟踪 所 有 未 响应 失效 的 电路 。 这 可 以 通过 把 与 失效 相关 的 信息 保存 在 特定 的 寄 
存 器 中 来 实现 。 无 锁定 高 速 缓 存在 20 世 纪 80 年 代 早 期 最 先 用 于 由 Control Data 公 司 4 生产 的 Cyber 
系列 计算 机 上 。 

我 们 已 经 把 软件 预 取 看 作 是 在 读 失 效 时 不 锁定 高 速 缓存 的 主要 动机 。 一 个 更 重要 的 诛 因 是 
在 使 用 流水 线 结构 的 处 理 器 中 ， 多 个 指令 的 执行 是 重 登 的 ， 一 条 指令 引起 的 读 失 效 会 停止 其 他 
指令 的 执行 。 无 锁定 高 速 缓存 减少 了 这 种 停止 的 可 能 性 。 我 们 在 第 8 章 中 会 再 提 到 这 个 主题 ， 在 
那里 将 详细 分 析 流水 线 结构 。 
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在 大 多 数 现代 计算 机 系统 中 , 物理 主 存 空 间 没 有 处 理 器 生成 的 地 址 所 能 跨越 的 空间 大 。 例 如 ， 
一 个 产生 32 位 地 址 的 处 理 器 有 4G 的 可 寻 址 空间 ， 而 典型 的 计算 机 中 主 存 容量 的 范围 只 是 从 几 百 
兆 到 1G 字 节 。 在 一 个 程序 还 没有 完全 装 入 主 存 中 时 ， 它 当前 未 被 执行 的 部 分 存放 在 辅助 存储 设 
备 上 ， 例 如 磁盘 。 当 然 ， 程 序 最 终 要 执行 的 所 有 部 分 都 要 预先 装 入 主 存 。 当 一 个 新 的 程序 段 要 移 
人 一 个 已 经 满 了 的 主 存 时 ， 必 须 替 换 已 经 在 主 存 中 存在 的 另 一 
个 程序 段 。 在 现代 计算 机 中 ， 操 作 系统 自动 在 主 存 和 辅助 存储 
设备 之 间 传送 程序 和 数据 。 因 此 ， 应 用 程序 员 不 需要 知道 可 用 
主 存 所 具有 的 限制 。 

在 执行 中 需要 程序 块 和 数据 块 时 自动 把 它们 移入 主 存 的 技 
术 称 为 虚拟 存储 器 技术 。 程 序 ， 其 实 也 就 是 处 理 器 ， 引 用 了 一 数据 
个 与 可 用 物理 主 存 空间 无 关 的 指令 和 数据 空间 。 处 理 器 生成 的 
指令 或 数据 的 二 进 制 地 址 称 为 虚拟 或 远 辑 地 址 。 这 些 地址 用 硬 
件 和 软件 结合 的 方法 转换 成 物理 地 址 。 如 果 一 个 虚拟 地 址 指向 
程序 空间 或 数据 空间 的 一 部 分 , 而 这 部 分 当前 位 于 物理 主 存 中 ， 
那么 主 存 中 对 应 位 置 的 内 容 可 以 立即 被 访问 。 而 相反 情况 ， 如 ”数据 | 物理 地 址 
果 引 用 地 址 不 在 主 存 中 ， 那 么 在 使 用 它 之 前 必须 把 它 的 内 容 放 
人 入 主 存 中 恰当 的 位 置 上 。 

图 5-26 给 出 了 实现 虚拟 存储 器 的 典型 组 织 结构 。 一 个 称 为 
ABERA (MMU) 的 特殊 硬件 把 虚拟 地 址 转换 成 物理 
地 址 。 当 需要 的 数据 (或 指令 ) 在 主 存 中 时 ， 这 些 数 据 通过 
前 面 描述 的 高 速 缓存 机 制 来 获取 。 如 果 数 据 不 在 主 存 中 , HB 
么 MMU 通 知 操作 系统 把 数据 从 磁盘 上 装 入 主 存 。 磁 盘 和 主 存 “图 5-26 虚拟 存储 器 组 织 结构 
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之 间 的 数据 传送 使 用 第 4 章 中 讨论 的 DMA 方 式 进行 。 
地 址 转换 


把 虚拟 地 址 转换 成 物理 地 址 的 简单 方法 就 是 假设 所 有 的 程序 和 数据 由 称 为 页 的 相同 长 度 单元 
组 成 ， 每 个 页 中 包含 主 存 占用 连续 单元 的 一 块 数据 。 页 的 长 度 通 常 是 从 2K 到 16K 字 节 。 当 转换 机 
制 确定 需要 做 一 次 移动 时 ， 页 构成 了 在 主 存 和 磁盘 之 间 移 动 信息 的 基本 单位 。 页 不 能 太 小 ， 因 为 
对 磁盘 访问 时 间 〈 几 毫秒 ) 比 对 主 存 访问 时 间 要 长 得 多 。 造 成 这 个 的 原因 是 磁盘 需要 花费 相当 长 
的 时 间 对 数据 做 定位 ， 但 是 一 旦 定位 ， 数 据 就 能 以 每 秒 几 兆 的 速度 传输 。 另 一 方面 ， 如 果 页 设置 
太 大 ， 那 么 页 中 很 大 一 部 分 数据 可 能 没有 被 用 到 ， 但 是 这 些 不 需要 的 数据 会 占用 主 存 的 有 用 空间 。 

这 个 讨论 与 5.5 节 中 在 高 速 缓存 上 引入 的 概念 类 似 。 高 速 缓存 在 处 理 器 与 主 存 之 间 的 速度 沟 
歼 上 搭 起 一 座 桥梁 ， 它 使 用 硬件 实现 ， 而 虚拟 存储 器 机 制 是 在 主 存 和 辅助 存储 设备 的 速度 询 餐 
上 架 桥 ， 它 的 实现 通常 部 分 地 使 用 了 软件 技术 。 从 概念 上 看 ， 高 速 缓存 技术 和 虚拟 存储 器 技术 
非常 相似 ， 它 们 的 区 别 主 要 在 实现 细节 上 。 

虚拟 存储 器 地 址 的 转换 方法 是 基于 图 5-27 中 所 描述 的 固定 长 度 页 的 概念 实现 的 。 处 理 器 产 
生 的 每 个 虚拟 地 址 ， 不 管 是 用 于 取 指 令 还 是 存 取 操作 数 ， 都 被 解释 成 虚拟 页 号 (高 地 址 位 ) 后 
边 跟 一 个 偏 移 量 ( 低 地 址 位 )， 用 来 在 一 个 页 内 指定 一 个 特定 字 节 (RF) 的 位 置 。 每 个 页 在 主 
存 中 的 位 置信 息 保存 在 页 表 中 。 这 个 信息 中 包括 页 所 在 的 主 存 地 址 和 当前 的 状态 。 主 存 中 能 保 
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器 的 内 容 相 加 就 能 得 到 这 个 页 在 页 表 中 相应 人 口 的 地 址 。 如 果 该 页 当前 位 于 主 存 中 ， 那 么 这 个 
单元 的 内 容 指出 这 个 页 的 起 始 地 址 。 
页 表 中 的 每 个 人 口 还 包含 一 些 控制 位 ， 当 该 页 在 主 存 中 时 ， 控 制 位 用 来 描述 它 的 状态 。 其 
中 一 位 用 来 表示 页 的 有 效 性 ， 即 这 个 页 是 否 确实 在 主 在 中 。 这 个 位 可 以 允许 操作 系统 标志 一 个 
页 无 效 ， 而 不 用 实际 移 除 这 个 页 。 另 一 个 位 表示 页 在 主 存 期 间 是 否 被 修改 过 。 与 高 速 缓存 一 样 ， 
这 个 信息 用 于 决定 在 为 其 他 页 腾 出 空间 而 移 除 这 个 页 之 前 是 否 需 要 把 它 的 内 容 写 回 到 磁盘 中 。 
还 有 一 个 控制 位 表示 对 访问 这 个 页 的 不 同 约束 。 例 如 ， 一 个 程序 可 能 有 完全 的 读 写 权限 ， 它 也 ”B39 
可 能 被 规定 成 只 能 读 取 。 
MMU 使 用 的 页 表 信 息 用 于 所 有 的 读 写 访问 ， 所 以 从 理想 角度 考虑 ， 页 表 应 该 放 在 MMU 内 部 。 
不 幸 的 是 ， 页 表 可 能 很 大 ， 由 于 MMU 一 般 作为 处 理 器 芯片 的 一 部 分 来 实现 《与 主 高 速 缓存 一 起 )， 
所 以 不 可 能 把 整个 页 表 放 到 芯片 内 。 因 此 将 页 表 保 存在 主 存 中 。 但 是 ， 页 表 的 一 小 部 分 的 拷贝 可 
以 放 入 MMU， 这 个 部 分 包括 那些 最 近 访问 页 所 对 应 的 入 口 。 为 了 这 个 目的 ， 把 一 小 块 通常 称 为 转 
换 监 视 缓冲 区 (TLB) 的 高 速 缓存 并 人 MMU。 对 主 存 中 页 表 的 TLB 操 作 本 质 上 与 在 讨论 高 速 缓存 
时 提 和 到 的 操作 相同 。 除 了 组 成 页 表 人 口 的 信息 外 ，TLB 中 还 必须 包含 人 口 的 虚拟 地 址 。 图 5-28 显 示 
了 TLB 可 能 的 一 种 组 织 结构 ， 这 里 使 用 了 关联 映射 技术 。 商 业 产品 中 也 有 使 用 组 相 联 映射 技术 的 。 — [49] 
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TLB 中 的 内 容 与 主 存 中 页 表 的 内 容 保持 一 致 是 一 个 基本 的 要 求 。 当 操作 系统 更 改 页 表 中 的 
内 容 时 ， 它 必须 同时 把 TLB 中 对 应 入 口 设 成 无 效 。TLB 中 的 一 个 控制 位 用 于 这 个 目的 。 当 一 个 
入 口 无 效 时 ，TLB 将 获取 新 的 信息 ， 这 是 MMU 对 访问 失效 进行 响应 的 一 个 步 又。 

接 下 来 是 地 址 变换 处 理 。 给 定 一 个 虚拟 地 址 ，MMU 在 TLB 中 搜索 引用 的 页 。 如 果 这 个 页 的 
页 表 入 口 在 TLB 中 ， 则 可 以 直接 获得 该 物理 地 址 。 如 果 TLB 失 效 ， 那 么 就 从 主 存 中 的 页 表 获 取 
需要 的 人口 ，TLB 同 时 被 更 新 。 

当 一 个 程序 发 出 访问 一 个 不 在 主 存 中 的 页 请 求 时 ， 我 们 说 发 生 一 次 页 故障 。 在 能 进行 访问 之 
前 必须 把 整个 页 从 磁盘 放 和 人 主 存 中 。 当 检测 到 一 个 页 故障 时 ，MMU 通 过 产生 一 个 异常 《中 断 ) 
来 请 求 操作 系统 进行 处 理 。 这 时 ， 当 前 执行 的 任务 被 中 断 ， 控 制 权 转移 到 操作 系统 。 操 作 系统 把 
请 求 的 页 从 磁盘 拷贝 到 主 存 中 ， 然 后 把 控制 权 交还 给 被 中 断 的 任务 。 因 为 页 传输 时 会 有 一 个 很 长 
的 延迟 ， 所 以 操作 系统 可 能 挂 起 引起 页 故障 的 任务 ， 然 后 开始 执行 另 一 个 页 在 主 存 中 的 任务 。 

必须 保证 被 中 断 的 任务 在 恢复 执行 后 能 正确 地 继续 执行 。 当 某 个 指令 访问 不 在 主 存 中 的 存 
储 器 操作 数 时 会 发 生 一 个 页 故障 ， 它 在 这 个 指令 完成 前 引发 一 个 中 断 。 因 此 ， 当 这 个 任务 恢复 
执行 时 ， 被 中 断 的 指令 要 么 从 中 断 点 继续 执行 ， 要 么 重新 开始 。 具 体 处 理 器 的 设计 决定 了 具体 
使 用 的 是 哪 一 种 方法 。 

当主 存 已 经 满 的 时 候 ， 如 果 从 磁盘 读 出 一 个 新 的 页 ， 那 么 必须 替换 一 个 已 经 存在 的 页 。 选 
择 哪 个 页 被 换 出 问题 的 重要 性 与 在 高 速 缓存 中 一 样 ， 程 序 把 大 多 数 时 间 花 费 在 一 个 局 部 区 域 中 
的 规律 在 这 里 也 同样 适用 。 因 为 主 存 要 比 高 速 缓存 大 得 多 ， 所 以 应 该 能 把 相对 应 的 程序 中 更 多 
的 部 分 放 入 到 主 存 中 ， 这 将 会 减少 向 或 从 磁盘 中 传输 数据 的 频率 。 与 LRU 赫 换算 法 类 似 的 概念 
也 可 以 用 于 页 替换 中 ， 页 表 入 口中 的 控制 位 可 以 指明 使 用 的 情况 。 一 个 简单 的 方案 是 基于 一 个 
控制 位 的 ， 当 相应 的 页 被 引用 (访问 ) 时 ， 这 个 控制 位 被 设 成 1。 操 作 系统 会 不 定时 地 清除 页 表 
所 有 入 口 的 这 个 位 ， 这 样 提 供 了 一 个 简单 的 方法 来 判断 最 近 哪 一 个 页 没有 被 使 用 过 。 

一 个 修改 过 的 页 在 移出 主 存 之 前 需要 写 回 到 磁盘 中 。 注 意 用 于 高 速 缓存 存储 器 结构 中 的 直 
接 写 协议 不 适合 虚拟 存储 器 ， 这 一 点 很 重要 。 磁 盘 的 访问 时 间 太 长 ， 经 常 向 里 面 写 人 少量 数据 
是 没有 意义 的 。 

MMU 中 的 地 址 转换 处 理 需 要 一 些 时 间 来 执行 ,这 主要 依赖 于 搜索 TLB 的 入 口 所 需要 的 时 间 。 
由 于 引用 的 局 部 性 ， 所 以 连续 的 地 址 转换 很 可 能 只 涉及 同一 个 页 上 的 地 址 。 这 种 情况 在 取 指令 
时 更 明显 。 这 样 ， 我 们 可 以 引入 一 个 或 多 个 特殊 寄存 器 来 保存 最 近 进 行 转换 的 虚拟 页 号 和 物理 
页 帧 ， 从 而 减少 平均 转换 时 间 。 访 问 这 些 寄存 器 中 的 信息 可 以 比 访问 TLB 更 快 。 


5.8 存储 器 管理 需求 


在 对 虚拟 存储 器 概念 的 讨论 中 ， 隐 含 地 假设 只 有 一 个 大 程序 在 执行 。 如 果 不 能 把 这 个 程序 
全 部 装 入 物理 存储 器 ,那么 它 的 一 部 分 (一些 页 ) 在 执行 时 将 从 磁盘 移 到 内 存 中 。 虽 然 我 们 间 
接地 提 到 了 管理 程序 段 移动 所 需要 的 软件 程序 ， 但 是 并 役 有 指出 它们 的 细节 内 容 。 

管理 程序 是 计算 机 操作 系统 的 一 部 分 。 操 作 系统 程序 可 以 很 便利 地 被 组 装 到 一 个 虚拟 地 址 空 
间 中 ， 这 个 空间 称 为 系统 空间 ， 它 与 用 户 程序 所 在 的 虚拟 地 址 空间 相 分 离 ， 后 一 个 空间 称 为 用 户 空 
间 。 实 际 上 ， 可 能 存在 多 个 用 户 空间 ， 每 个 用 户 -一 个 ， 这 可 以 通过 为 每 个 用 户 的 程序 提供 一 个 单独 
的 页 表 来 实现 。MMU 使 用 页 表 基 址 寄存 器 来 判断 在 转换 过 程 中 使 用 的 页 表 ， 因 此 ， 通 过 修改 这 个 
寄存 器 的 内 容 ， 操 作 系统 就 可 以 从 一 个 空间 转换 到 另 一 个 空间 。 于 是 ， 物 理 主 存储 器 由 系统 空间 和 





多 个 用 户 空间 的 活动 页 共同 分 享 ， 但是， 在 给 定时 刻 ， 只 有 属于 其 中 一 个 空间 的 页 能 被 访问 。 

在 任何 允许 独立 用 户 程序 在 内 存 中 共 在 的 计算 机 中 ， 必 须 解决 保护 的 问题 ， 任 何 程序 都 不 
能 破坏 内 存 中 其 他 程序 的 指令 和 数据 。 这 种 保护 可 以 通过 几 种 方法 来 提供 。 让 我 们 首先 来 考虑 
最 基本 的 保护 形式 。 回 想 一 下 最 简单 的 情况 ， 处 理 器 有 两 个 状态 ， 分 别 是 管 态 和 用 户 状态 。 就 
像 名 称 所 示 的 那样 ， 当 执行 操作 系统 程序 时 ， 处 理 器 处 于 管 态 ， 而 执行 用 户 程序 时 ， 处 理 器 处 
于 用 户 状 态 。 在 用 户 状态 下 ， 有 一 些 指令 处 理 器 不 能 执行 。 这 些 特 权 指 令 ， 包 括 像 修改 页 表 基 
址 寄存 器 这 样 的 操作 ， 只 能 在 处 理 器 处 于 管 态 时 才能 执行 。 因 此 ， 用 户 程序 不 能 访问 其 他 用 户 
空间 的 页 表 和 系统 空间 的 页 表 。 

有 时 候 一 个 应 用 程序 要 求 访问 属于 另 一 个 程序 的 页 ， 操 作 系统 通过 使 这 个 页 在 两 个 空间 中 
都 可 见 来 实现 这 一 点 ， 因 而 这 个 共享 的 页 在 两 个 不 同 的 页 表 中 都 有 人 人口。 在 每 个 页 表 中 人 口 的 
控制 位 可 以 用 来 控制 相应 程序 的 访问 权限 。 例 如 对 一 个 给 定 的 页 ， 一 个 程序 可 能 允许 读 和 和 写 ， 
而 另 一 个 程序 只 有 读 权限 。 


5.9 辅助 存储 器 


前 面 章节 讨论 的 半导体 存储 器 并 不 能 提供 计算 机 需要 的 全 部 存储 能 力 ， 主 要 限制 是 每 位 存 
储 信息 的 成 本 。 大 多 数 计算 机 系统 的 大 量 存储 需求 使 用 更 经 济 的 磁盘 、 光 盘 和 磁带 实现 ， 它 们 
通常 称 为 辅助 存储 器 设备 。 


5.9.1 磁性 硬盘 


顾名思义 ， 在 磁盘 系统 中 存储 介质 由 安装 在 一 个 轴 上 的 一 个 或 多 个 磁盘 组 成 。 在 每 个 盘 上 
覆盖 着 一 层 很 落 的 磁性 薄膜 ， 通 常 两 面 都 有 。 盘 放 在 一 个 旋转 的 驱动 器 上 ， 这 样 磁性 表面 就 可 
以 在 读 写 磁头 附近 移动 ， 像 图 5-29a 所 示 的 那样 。 各 个 磁盘 以 一 个 统一 的 速度 旋转 。 每 个 磁头 包 
括 一 个 磁 示 和 一 个 磁性 线圈 ， 如 图 5-29b 所 示 。 

数字 信息 可 以 通过 向 磁性 线圈 施加 适当 极 性 的 电流 脉冲 来 存储 到 磁性 薄膜 上 ， 这 导致 磁头 
下 的 薄膜 区 域 的 磁化 方向 与 施加 的 磁场 同 向 。 这 个 磁头 还 可 以 用 于 读 取 存 储 的 信息 ， 此 时 ， 磁 
性 薄膜 相对 磁 轿 的 运动 导致 磁头 附近 的 磁场 发 生变 化 ， 这 会 在 磁性 线圈 中 感应 出 电压 ， 这 时 这 
个 线圈 用 作 传 感 线圈 。 由 控制 电路 检测 到 的 电压 正 负 用 来 判断 薄膜 的 磁化 状态 。 只 有 在 读 操作 
时 才能 感应 到 磁头 下 磁场 的 变化 。 因 此 ， 如 果 二 进 制 状态 0 和 1 用 磁化 的 两 个 相反 的 状态 表示 ， 
那么 只 有 在 位 流 中 0 变 成 1 或 1 变 成 0 时 ， 磁 头 才能 感应 出 电压 ， 一 长 串 0 或 1 只 有 在 这 个 串 的 开头 
和 结尾 才能 产生 感应 电压 。 为 了 判断 存储 的 连续 0 或 1 的 个 数 ， 必 须 用 一 个 时 钟 提供 同步 信息 。 
在 早期 的 设计 中 ， 时 钟 被 存储 在 一 个 单独 的 磁道 中 ， 这 个 磁道 在 每 个 位 周期 中 磁性 都 必须 改变 。 
以 这 个 时 钟 信号 为 参照 ， 存 储 在 其 他 磁道 中 的 数据 就 能 正确 读 出 了 。 

现代 的 方法 是 把 时 钟 信 息 结合 到 数据 中 ， 现 在 已 经 开发 出 几 种 不 同 的 技术 用 于 这 种 编码 。 
一 种 简单 的 方案 在 图 5-29c 中 给 出 ， 它 被 称 为 相位 编码 或 更 彻 斯 特 编码 。 在 这 种 方案 中 ， 每 个 位 
都 有 磁性 变化 发 生 ， 如 图 所 示 。 注 意 要 确保 磁性 变化 在 每 个 位 周期 的 中 点 发 生 ， 以 此 来 提供 时 
钟 周期 。 曼 彻 斯 特 编码 的 缺点 是 它 的 位 存储 密度 较 低 ， 表 示 一 位 需要 的 空间 必须 足够 大 ， 以 容 
纳 磁 性 的 两 个 变化 。 曼 彻 斯 特 编码 的 例子 阐述 了 如 何 实现 一 个 自 同步 时 钟 方案 ， 因 为 它 比较 好 
理解 。 人 们 还 开发 了 一 些 更 紧凑 的 编码 ， 它 们 更 有 效 ， 能 提供 更 高 的 存储 密度 ， 但 同时 也 需要 
更 复杂 的 控制 电路 。 对 这 些 编码 的 讨论 超出 了 本 书 的 范围 。 





w 
CA 


244 £ 5 * 








HERA 磁化 电流 
` T | 
bi 
/ = asam N 
at | 
访问 机 制 破 性 济 腊 
a) 机 械 结构 b) 读 / 写 磁头 细节 





o e) 使 用 相位 编码 表示 位 
图 5-29 磁盘 原理 


读 写 磁头 必须 与 转动 的 盘面 保持 一 个 很 近 的 距离 ， 以 此 来 获得 较 高 的 位 密度 和 可 靠 的 读 写 
操作 。 当 磁盘 以 一 个 稳定 的 速度 旋转 时 ， 在 盘面 和 磁头 之 闻 会 产生 一 个 空气 压力 ， 迫 使 磁头 远 
离 盘 面 。 这 个 力 可 以 由 一 个 弹 换 装置 抵消 ， 这 个 装置 把 磁头 压 向 盘面 。 在 磁头 和 它 的 支撑 项 之 
间 有 灵活 的 弹 筑 连接 ， 这 允许 磁头 在 离开 盘面 所 需 距 离 的 位 置 上 悬 置 ， 可 以 免 受 磁盘 表 平面 微 
小 起 伏 的 影响 。 

在 多 数 现代 磁盘 部 件 中 ， 盘 体 和 磁头 被 放 在 一 个 密封 的 、 对 空气 进行 过 滤 的 外 壳 中 ， 这 个 
方法 称 为 温 切 斯 特技 术 。 在 这 样 的 部 件 中 ， 读 写 磁头 可 以 在 距离 磁化 轨迹 表面 更 近 的 位 置 上 工 
作 ， 因 为 里 面 不 存在 灰尘 微粒 ， 而 灰尘 微粒 是 未 密封 组 装 中 的 难题 。 磁 头 离 磁 道 表面 越 近 ， 数 
据 就 能 以 越 高 的 密度 沿 着 磁道 存放 ， 磁 道 之 间 的 距离 也 越 近 。 因 此 ， 在 给 定 物理 尺寸 的 条 件 下 ， 
温 切 斯 特 磁盘 的 容量 比 未 密封 部 件 更 大 。 温 切 斯 特技 术 的 另 一 个 优势 是 在 密封 部 件 中 ， 存 储 介 
质 没 有 暴露 在 污染 环境 中 ， 因 而 数据 有 更 好 的 完整 性 。 

磁盘 系统 中 的 读 / 写 磁头 是 可 移动 的 。 每 个 盘面 有 一 个 磁头 ， 所 有 的 磁头 都 安装 在 一 个 梳 状 
支撑 移 上 ， 这 个 支撑 警 可 以 在 半径 方向 上 横 跨 磁盘 的 磁道 运动 ， 实 现 了 对 单个 磁头 的 访问 ， 如 
图 5-29a 中 所 示 。 要 在 一 个 给 定 的 磁道 上 读 或 写 数据 ， 装 有 读 写 磁头 的 支撑 臂 必 须 首先 定位 到 读 
磁道 上 。 

磁盘 系统 包括 三 个 关键 部 分 。 第 一 个 部 分 是 装配 的 盘 体 ， 通 常 称 为 磁盘 。 第 二 个 部 分 是 电 
机 装置 ， 用 来 旋转 磁盘 和 移动 读 写 磁 头 ， 这 称 为 磁盘 驱动 器 。 第 三 个 部 分 是 控制 系统 运作 的 控 
制 电路 ， 称 为 磁盘 控制 器 。 磁 盘 控制 器 可 以 实现 成 一 个 单独 的 模块 ， 也 可 以 放 在 包含 整个 磁盘 
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系统 的 外 过 中 。 我 们 已 经 注意 到 通常 把 磁盘 驱动 器 与 磁盘 合 起 来 称 为 磁盘 ， 在 后 面 的 章节 中 如 
果 没 有 歧义 ， 我 们 也 使 用 这 种 叫 法 。 

磁盘 数据 的 组 织 结构 和 访问 

磁盘 上 数据 的 结构 如 图 5-30 所 示 ， 每 个 面 都 被 分 成 同心 的 磁道 ， 每 个 磁道 又 分 成 扇 区 。 各 
个 表面 上 相同 磁道 的 集合 形成 巡 辑 上 的 柱 面 ， 不 需 移动 读 写 磁头 就 可 以 访问 一 个 柱 面 中 各 个 磁 
道上 的 数据 。 数 据 通过 指定 表面 号 、 磁 道 号 和 扇 区 号 来 访问 ， 读 写 操作 在 遍 区 边界 处 开始 。 
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图 5-30 磁盘 一 个 表面 的 结构 


数据 位 顺序 存在 每 个 磁道 中 。 每 个 局 区 通常 包含 5312 字 节 的 数据 ,但 是 也 有 使 用 其 他 尺寸 的 。 
数据 的 前 面 有 一 个 扇 区 头 ， 包 含 标志 (hk) 信息 ， 这 些 信息 用 来 在 选 定 的 磁道 上 找到 需要 的 
扇 区 。 在 数据 后 面 有 一 些 由 纠 错 码 (ECC) 组 成 的 附加 位 。ECC 位 用 来 检测 和 纠正 在 读 写 这 512 
字 节 数据 时 可 能 发 生 的 错误 。 为 了 便于 区 别 两 个 连续 的 区 ， 扁 区 间 存 在 一 个 请 区 间 阶 。 

一 个 未 格式 化 磁盘 的 磁道 上 没有 任何 信息 ， 格 式 化 过 程 把 磁盘 从 物理 上 分 成 磁道 和 扇 区 。 
这 个 过 程 可 能 会 发 现 一 些 有 缺陷 的 扁 区 ， 其 至 是 整个 磁道 ， 磁 盘 榨 制 器 保存 这 些 缺 陷 的 记录 ， 
并 在 使 用 时 排除 这 些 扇 区 。 格 式 化 后 的 磁盘 容量 是 一 个 给 定 磁盘 存储 容量 的 很 好 的 指标 。 格 式 
信息 占 磁 盘 能 存储 的 全 部 信息 的 15% ， 它 包括 扇 区 头 、ECC 位 和 扇 区 间 耻 。 在 一 台 典 型 的 计算 机 
中 ,磁盘 又 被 分 成 逻辑 分 区 。 至 少 存在 一 个 这 样 的 分 区 ， 称 为 主 分 区 ， 可 以 有 多 个 附加 的 分 区 。 

图 5-30 说 明 每 个 磁道 有 相同 数目 的 遍 区 ， 所 以 所 有 的 磁道 有 相同 的 存储 容量 。 因 此 ， 存 储 
的 信息 在 靠 里 的 磁道 上 比 靠 外 的 磁道 放 得 更 密 。 这 种 布局 在 很 多 磁盘 上 使 用 ， 因 为 它 简化 了 访 
问 数 据 需要 的 电路 。 但 是 ， 我 们 可 以 通过 在 周 长 更 长 的 外 侧 磁道 上 放置 更 多 的 信息 来 增加 存储 
密度 ， 这 需要 使 用 更 加 复杂 的 访问 电路 。 这 种 方案 用 在 大 型 磁盘 上 。 

访问 时 间 

从 接收 地 址 到 开始 实际 传输 数据 之 间 的 时 间 延 迟 包含 两 个 部 分 。 第 一 个 部 分 称 为 寻 道 时 间 ， 
是 把 读 写 磁头 移动 到 恰当 磁道 所 需 的 时 间 ， 它 依赖 于 开始 时 磁头 到 地 址 对 应 磁道 的 相对 位 置 。 
寻 道 时 间 的 平均 值 在 3~8 毫 种 的 范围 内 。 第 二 个 部 分 称 为 旋转 延迟 或 等 待 时 间 ， 它 是 从 磁头 定位 
到 正确 磁道 直到 地 址 指定 遍 区 的 起 始 位 置 经 过 磁头 下 方 所 用 的 时 间 。 平 均 起 来 ， 这 是 磁盘 转动 
半 周 所 花 的 时 间 。 这 两 个 延迟 的 总 和 称 为 访问 时 间 。 如 果 在 一 次 操作 中 只 有 少数 扇 区 的 数据 被 
传输 ， 那 么 访问 时 间 至 少 比 实际 数据 传输 周期 高 一 个 数量 级 。 





O 


6 LE 


典型 的 磁盘 

现在 使 用 的 3.5 英 寸 (直径 ) 高 密度 高 数据 速率 磁盘 有 以 下 典型 参数 。 它 有 20 个 数据 记录 面 ， 
每 个 面 有 15 000 个 磁道 ， 每 个 磁道 有 400 个 遍 区 ， 而 每 个 扇 区 包含 5312 个 字 池 的 数据 。 于 是 ， 格 式 
化 过 的 磁盘 总 容量 是 20 x 15 000 x 400 x 512 = 60 x 10?= 60G。 平 均 寻 道 时 间 是 6 毫秒 。 盘 体 转速 
是 每 分 钟 10 000 转 ， 所 以 平均 等 待 时 间 是 3 毫秒 ， 即 转 半 圈 的 时 间 。 从 磁道 到 磁盘 控制 器 的 数据 
缓冲 区 的 平均 内 部 传输 速率 是 每 秒 34M 字 节 。 当 连接 到 SCSI 总 线 时 ， 这 种 类 型 的 驱动 器 可 以 有 
每 秒 160M 的 外 部 传输 速率 。 因 此 需要 一 个 缓冲 方案 来 处 理 传输 速度 上 的 不 同 ， 这 在 下 一 池 解 释 。 

也 有 一 些 很 小 的 磁盘 。 例 如 一 英寸 的 磁盘 可 以 存储 1G 的 数据 ， 它 的 物理 尺寸 与 一 个 纸板 火 
具 相 当 ， 重 量 小 于 1 次 司 。 这 样 的 磁盘 在 便携 设备 和 和 手持 设备 应 用 中 很 有 吸引 力 。 在 一 个 数码 相 
机 中 ， 一 个 这 样 的 磁盘 可 以 存储 1000 幅 照片 。 现 在 看 IBBM 公 司 在 1980 年 生产 的 第 一 个 容量 为 1G 
的 磁盘 很 有 意思 ， 它 有 一 个 厨具 那么 大 ， 重 达 250 千 克 ， 价 值 40 000 美 元 。 

数据 缓冲 区 /高 速 缓存 

一 个 磁盘 驱动 器 使 用 一 些 标准 的 连接 方案 连 到 计算 机 系统 的 其 他 部 分 上， 通常 使 用 标准 总 
tko 例如 在 4.7.2 节 中 讨论 的 SCSI 总 线 。 包 含 所 需 的 SCSI 接 口 电路 的 磁盘 驱动 器 通常 称 为 SCSI 驱 
动 器 。SCSI 总 线 传 输 数据 的 速率 要 比 从 磁盘 的 磁道 读数 据 的 速率 快 得 多 ， 处 理 磁盘 和 SCSI 总 线 
之 间 的 传输 速率 差异 的 一 个 有 效 方 法 是 在 磁盘 部 件 中 引入 一 个 数据 缓冲 区 。 这 个 缓冲 区 是 一 个 
半导体 存储 器 ， 能 存储 几 兆 的 数据 。 请 求 的 数据 在 磁盘 磁道 和 缓冲 区 之 间 传 输 ， 传 输 速 率 依赖 
于 磁盘 转速 。 在 数据 缓冲 区 和 总 线 上 其 他 设备 之 间 的 传输 能 以 总 线 允 许 的 最 大 速度 进行 ， 这 里 
所 说 的 其 他 设备 通常 是 指 主 存 。 

数据 缓冲 区 还 能 用 来 为 磁盘 提供 高 速 缓存 机 制 。 当 一 个 读 请 求 到 达 磁 盘 时 ， 控 制 器 可 以 先 
检查 所 要 的 数据 是 否 已 经 在 高 速 缓 存 〈 缓 冲 区 ) 中 。 如 果 在 ， 那 么 可 以 在 微 秒 级 访问 数据 并 把 
它们 故 在 SCSI 总 线 上 ， 而 不 是 毫秒 级 。 如 果 不 在 ， 那 么 使 用 通常 的 办 法 把 数据 从 磁盘 磁道 上 读 
出 ,然后 存 人 高 速 缓 存 中 。 由 于 后 面 的 读 请 求 很 可 能 会 请 求 当前 访问 数据 后 续 的 数据 ， 所 以 磁 
盘 控 制 器 可 以 读 取 比 需要 数据 更 多 的 数据 ， 并 把 它们 放 入 高速 缓存 ， 这 样 会 潜在 地 缩短 下 一 次 
请 求 的 响应 时 间 。 这 个 高 速 缓存 通常 足够 大 ， 能 放下 整个 磁道 的 数据 ， 所 以 一 个 可 能 的 策略 是 
读 写 磁头 一 到 达 所 需 磁道 上 方 就 开始 传输 这 个 磁道 的 内 容 。 

磁盘 控制 器 

磁盘 驱动 器 的 操作 由 磁盘 控制 器 电路 控制 ， 上 外 这 个 电路 还 提供 磁盘 驱动 器 和 总 线 之 问 的 
接口 ， 总 线 用 来 把 磁盘 驱动 器 连 到 计算 机 系统 的 [ = ] ' 
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其 他 部 分 。 磁盘 控制 器 可 以 用 来 控制 多 个 驱动 器 。 
图 5-31 显 示 了 一 个 磁盘 控制 器 ， 它 控制 了 两 个 磁 
盘 驱 动 器 。 

磁盘 控制 器 直接 连 到 处 理 器 的 系统 总 线 或 扩 
展 总 线 上 ， 例 如 PCI， 其 中 包括 可 由 操作 系统 读 
写 的 多 个 寄存 器 。 于 是 操作 系统 和 磁盘 控制 器 之 
间 的 通讯 可 以 使 用 与 MO 接口 相同 的 方法 实现 ， 
就 像 在 第 4 章 中 讨论 的 那样 。 磁 盘 控 制 器 使 用 
DMA 方 案 在 磁盘 和 主 存 之 间 传 输 数据 。 实 际 上 ， | 
这 些 传输 是 从 或 者 向 数据 缓冲 区 进行 的 操作 ， 它 图 5-31 连 在 系统 总 线 上 的 磁盘 
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作为 磁盘 控制 器 的 一 部 分 来 实现 。 BIPRAR R SAREE, AREEN 
址 和 控制 信息 装 入 控制 器 寄存 器 ， 通 党 

主 存 地 下 -传输 中 涉及 的 字 块 的 第 个 主 存单 元 的 地 直 。 

磁盘 地 址 一 -包含 所 需 字 块 起 始 位 置 的 扁 区 单元 。 

字数 一 传输 块 中 的 字数 。 
操作 系统 发 出 的 磁盘 地 址 是 逻辑 地 址 ， 它 与 磁盘 上 对 应 的 物理 地 址 可 能 不 一 样 。 例 如 ， 磁 盘 在 
格式 化 时 检测 到 了 坏 扁 区， 磁盘 控制 器 记录 这 些 遍 区 ， 然 后 用 其 他 扇 区 代替 。 通 常 ， 在 每 个 磁 
道 或 同一 个 柱 面 的 其 他 磁道 中 保留 了 一 些 空闲 扁 区 ， 用 作 坏 遍 区 的 替代 品 。 

从 磁盘 驱动 器 的 角度 来 看 ， 控 制 器 的 主要 功能 是 : 

寻 道 一 使 磁盘 驱动 器 把 读 写 磁 头 从 当前 位 置 移动 到 需要 的 磁道 上 。 

读 -一 初始 化 一 个 读 操 作 ， 从 磁盘 地 址 寄存 器 指定 的 地 址 开始 。 从 磁盘 顺序 读 出 的 数据 被 
组 装 成 字 ， 并 被 放 入 数据 缓冲 区 ， 用 来 向 主 存 传输 。 字 数 由 字 计 数 寄存 器 决定 。 

写 一 使 用 类 似 于 读 操 作 的 控制 方法 把 数据 传输 到 磁盘 上 。 

错误 检查 一 -计算 从 指定 扇 区 读 出 的 数据 的 纠 错 码 (ECC) 值 ， 把 它 与 从 磁盘 读 出 的 相应 纠 
错 码 值 做 比较 。 不 匹配 时 ， 如 果 能 纠正 ， 它 就 纠正 这 个 错误 ， 否 则 产生 一 个 中 断 ， 通 知 操作 系统 
发 生 了 一 个 错误 。 在 写 操作 期 间 ， 控 制 器 计算 要 写 人 的 数据 的 ECC 值 ， 并 杷 这 个 值 存 到 磁盘 上 。 

如 果 磁 盘 驱动 器 连接 到 一 个 分 包 传输 的 总 线 上 ， 那 么 控制 器 必须 能 够 处 理 这 样 的 传输 。 例 
如 ， 一 个 用 于 SCSI 驱 动 器 的 控制 器 要 遵从 第 4 章 找 述 的 SCSI 协 议 。 

软件 和 操作 系统 的 含义 

所 有 涉及 磁盘 的 数据 传输 活动 都 是 由 操作 系统 发 起 的 。 磁 盘 是 非 易 失 存 储 介质 ， 所 以 操作 
系统 本 身 也 存储 在 磁盘 上 。 在 计算 机 正常 操作 期 间 ， 操 作 系统 的 一 部 分 被 装 入 主 存 ， 按 需要 进 
行 执行 。 

当 电源 关闭 时 ， 主 存 的 内 容 都 丢失 了 。 当 电源 重新 打开 时 ， 操 作 系 统 必须 重新 装 入 主 存 ， 
这 是 引导 程序 的 一 部 分 工作 。 为 了 开始 引导 ， 主 存 的 一 小 部 分 用 非 易 失 的 ROM 实 现 。 在 ROM 中 
存储 一 个 小 的 监控 程序 ， 能 读 写 主 存 ， 也 能 读 取 存储 在 磁盘 地 址 9 上 的 一 块 数据 。 这 个 块 称 为 引 
叶 块 ， 它 包含 有 一 个 装载 程序 。 当 ROM 监 控 程 序 把 引导 块 装 入 主 存 后 ， 引 导 块 把 操作 系统 的 其 
他 部 分 导入 主 存 。 

与 主 存 访问 相 比 ， 磁 盘 访问 非常 慢 ， 这 主要 是 由 于 长 时 间 的 寻 道 。 当 操作 系统 初始 化 一 个 
磁盘 传输 操作 后 ， 它 通常 转向 另 一 个 任务 的 执行 ， 以 保证 时 间 的 有 效 利 用 ， 和 否则 这 个 时 间 被 用 
来 等 待 传输 的 完成 。 磁 盘 控制 器 通过 产生 一 个 中 断 来 通知 操作 系统 传输 完成 。 

在 包含 多 个 磁盘 的 计算 机 系统 中 操作 系统 可 以 涉及 多 个 需要 的 磁盘 传输 。 如 果 一 个 磁盘 正 
在 进行 从 它 或 向 它 的 DMA 传 输 时 ， 另 一 个 磁盘 在 做 寻 道 ， 那 么 就 可 以 获得 高 效 的 操作 。 操 作 系 
统 可 以 安排 这 些 重生 的 WO 活动 。 

软盘 

前 面 讨论 的 设备 叫做 硬盘 部 件 ， 软 胡 是 更 小 、 更 简单 、 更 廉价 的 磁盘 部 件 ， 它 包含 一 个 柔 
软 的 可 移动 的 塑料 磁盘 ， 这 个 磁盘 覆盖 着 一 层 磁性 材料 。 磁 盘 装 在 一 个 塑料 的 外 这 中 ， 这 个 外 
光 带 一 个 开口 ， 读 写 磁头 从 开口 处 接触 磁盘 。 磁 盘 驱 动 器 的 旋转 轴 可 以 插入 磁盘 中 心 的 一 个 孔 
中 转动 磁盘 。 

软盘 在 存储 数据 时 使 用 的 一 个 最 简单 方案 是 前 面 提 到 的 相位 或 曼彻斯特 编码 。 我 们 说 按 这 
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种 方法 编码 的 磁盘 只 有 单 密 度 。 这 个 方案 的 一 个 更 复杂 的 变 体 称 为 双 密 度 ， 它 通常 用 于 现在 的 
标准 软盘 。 双 密度 方案 把 存储 密度 增加 了 一 倍 ， 但 是 同时 也 需要 在 磁盘 控制 器 中 使 用 更 复杂 的 
电路 。 

软盘 的 主要 特点 是 低 成 本 和 可 以 方便 地 移动 ， 但 是 与 硬盘 相 比 ， 它 们 的 容量 小 得 多 ， 访 问 
时 间 更 长 ， 并 且 失 败 率 更 高 。 当 前 标准 的 软盘 直径 为 3.25 英 寸 ， 存 储 1.44M 或 2M 字 节 的 数据 。 
现在 也 有 更 大 的 超级 软盘 ， 这 样 的 软盘 称 为 zip 盘 ， 能 存储 超过 100M 字 节 的 数据 。 近 年 来 ， 随 着 
可 擦 写 光盘 的 出 现 ， 软 盘 技 术 的 吸引 力 正在 下 降 。 光 盘 在 下 面 讨 论 。 

RAID 磁 盘 阵 列 

处 理 器 速度 在 过 去 的 10 年 中 显著 地 增加 ， 处 理 器 性 能 每 18 个 月 就 翻 一 番 。 半 导体 存储 器 的 
速度 提高 得 要 慢 一 些 。 而 就 速度 而 言 相 对 提高 最 慢 的 是 磁盘 存储 设备 ， 它 的 访问 时 间 仍 在 毫秒 
级 。 当 然 ， 这 些 设备 在 存储 容量 上 有 很 大 的 提高 。 

高 性 能 设备 更 贵 一 些 ， 有 了 时 使 用 低 成 本 设备 进行 并 行 操作 也 可 以 用 合理 的 成 本 获得 很 高 的 
性 能 。 在 第 12 章 将 看 到 如 何 使 用 多 个 普通 处 理 器 来 实现 高 性 能 的 多 处 理 器 计算 机 系统 。 多 个 磁 
盘 驱 动 器 也 可 以 用 来 提供 高 性 能 的 存储 部 件 。 

在 1988 年 ， 在 加 州 大 学 伯克利 分 校 进 行 的 研究 提出 了 一 个 基于 多 个 驱动 器 的 存储 系统 ， 他 
们 称 之 为 RAID ， 表 示 廉 价 磁盘 宛 余 阵列 (Redundant Array of Inexpensive Disk)。 使 用 多 个 磁盘 
还 可 以 提高 系统 的 总 体 可 靠 性 。 提 出 了 六 种 不 同 的 配置 结构 ， 它 们 被 称 为 RAID 的 层次 ， 虽 然 这 
些 并 不 涉及 层次 结构 。 

RAID 0 是 基本 的 结构 ， 用 来 增强 性 能 。 一 个 单独 的 大 文件 被 分 成 一 些小 块 ， 把 这 些小 块 存 
到 不 同 的 磁盘 上 ， 从 而 实现 把 这 个 文件 存储 到 不 同 的 磁盘 上 ， 这 称 为 数据 末 带 化 。 当 读 取 这 个 文 
件 的 时 候 ， 所 有 的 磁盘 可 以 并 行 传递 它们 的 数据 。 文 件 的 总 传输 时 间 等 于 一 个 单独 磁盘 的 系统 所 
需要 的 时 间 除 以 阵列 中 使 用 的 磁盘 个 数 ， 但 是 单个 磁盘 的 访问 时 间 ， 也 就 是 用 于 定位 数据 起 点 的 
寻 道 和 旋转 延迟 并 没有 减少 。 实 际 上 ， 由 于 一 个 磁盘 的 操作 独立 于 其 他 磁盘 ， 所 以 访问 时 间 各 不 
一 样 ， 需 要 对 访问 的 数据 块 进行 缓冲 ， 以 便 能 把 文件 完整 地 组 装 起 来 ， 并 把 它 作 为 一 个 单一 的 实 
体 发 送 给 请 求 的 处 理 器 。 这 是 最 简单 的 磁盘 阵列 操作 ， 它 只 是 提高 了 数据 流 的 时 间 性 能 。 

RAID 1 用 来 提供 更 高 的 可 靠 性 ， 它 把 数据 的 相同 备份 放 到 两 个 磁盘 上 ， 而 不 是 一 个 。 这 两 
个 磁盘 相互 称 为 彼此 的 镜像 。 那 么 如 果 一 个 磁盘 出 错 了 ， 所 有 的 读 写 操作 都 指向 它 的 镜像 。 这 
是 用 高 昂 的 代价 提高 可 靠 性 的 方法 ， 因 为 所 有 的 磁盘 都 是 宛 余 的 。 

RAID 2, RAID 3 和 RAID 4 层次 通过 不 同 的 奇偶 校 验方 案 来 获得 更 高 的 可 靠 性 ， 它 们 不 需要 
整个 磁盘 的 副本 ， 所 有 的 奇偶 信息 存储 在 一 个 磁盘 上 。 

RAID 5 也 使 用 基于 奇偶 校 验 的 错误 恢复 方案 ， 但 奇偶 信息 分 布 在 各 个 磁盘 中 ， 而 不 是 只 在 
一 个 磁盘 上 。 

后 来 一 些 混合 方案 被 开发 出 来 。 例 如 ，RAID 10 是 结合 了 RAID 0 和 RAID 1 特征 的 阵列 。 对 
于 RAID 方 案 的 更 详细 分 析 可 以 在 参考 文献 [6~10] 中 找到 。 

RAID 概 念 已 经 被 商家 接受 , 例如 Dell 公 司 提供 基于 RAID 0. RAID 1 和 RAID 5 的 产品 。 最 后 ， 
我 们 应 该 注意 到 ， 在 过 去 的 几 年 里 随 着 磁盘 驱动 器 价格 的 大 幅 下 降 ， 在 RAID 中 再 说 “廉价 ” 磁 
盘 可 能 不 合适 了 。 实 际 上 ，RAID 已 经 被 工业 界 重新 定义 为 “独立 ”磁盘 的 代表 。 

商用 磁盘 考虑 

大 多 数 磁盘 部 件 都 设计 成 连 到 标准 的 总 线 上 。 一 个 磁盘 部 件 的 性 能 依赖 于 它 的 内 部 结构 和 





用 于 连接 系统 其 他 部 分 的 接口 。 成 本 主要 依赖 于 存储 容量 ， 但 它 也 很 大 程度 上 受 特定 产品 销量 
的 影响 。 

AIA/EIDE 磁盘 ”使 用 最 广泛 的 计算 机 是 由 IBM 在 1980 年 推出 的 个 人 计算 机 (PC), REK 
家 熟知 的 IBM PC。 用 于 连接 到 IBM PC 总 线 的 磁盘 接口 已 经 被 开发 出 来 ， 它 的 当前 (增强) 版 本 
成 为 了 一 个 标准 ， 称 为 EIDE (Enhanced Integrated Drive Electronics， 增 强 型 集成 驱动 器 电路 ) 
或 ATA (Advanced Technology Attachment， 高 级 技术 配件 )。 很 多 磁盘 制造 商都 生产 有 EIDE/ATA 
接口 的 磁盘 ， 这 种 磁盘 可 以 直接 连 到 PCI 总 线 (在 4.7.1 节 讨论 )，PCI 总 线 用 在 很 多 PC 上 。 实 际 
上 ，Intel 的 Pentium 芯 片 系列 包含 一 个 控制 器 ， 人 允许 EIDE/ATA 驱 动 器 直接 连 到 主板 上 。 
EIDE/ATA 驱 动 器 的 一 个 重要 优势 是 它们 的 低 价格 ,这 是 因为 它们 是 用 于 PC 市 场 的 。 其 主要 缺点 
是 如 果 同 时 使 用 两 个 驱动 器 来 提高 性 能 ， 每 个 驱动 器 都 需要 一 个 单独 的 控制 器 。 

SCSI E ”就 像 我 们 在 前 面 例子 中 解释 的 那样 ， 很 多 磁盘 都 有 一 个 用 来 连接 标准 SCSI 总 线 
的 接口 。 这 些 磁 盘 更 贵 一 些 , 但 是 它们 表现 出 更 好 的 性 能 ， 这 是 由 SCSI 总 线 相对 于 PCI 总 线 的 优 
势 造成 的 。 可 以 对 多 个 磁盘 驱动 器 同时 访问 ， 因 为 只 有 当 了 驱动 器 准备 好 进行 数据 传输 时 ， 它 的 
接口 才 真 正 连接 到 SCSI 总 线 上 。 对 于 那些 有 很 多 小 文件 的 访问 请 求 应 用 来 说 ， 这 一 点 特别 有 用 ， 
这 种 情况 通常 发 生 在 用 于 文件 服务 器 的 机 器 上 。 

RAID#Æ#Ė RAID 磁 盘 具 有 优良 的 性 能 ， 并 能 提供 大 容量 高 可 靠 性 的 存储 。 它 们 用 在 高 性 能 
计算 机 中 ， 或 用 于 那些 需要 更 高 可 靠 性 级 别 的 系统 中 。 随 着 其 价格 降 到 更 低 的 水 平 ， 它 们 在 中 
等 规模 的 计算 机 系统 中 也 变 得 很 有 吸引 力 。 
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大 容量 存储 设备 也 可 以 使 用 光学 方法 实现 ,人们 熟知 的 用 于 音频 系统 的 光盘 (Compact Disk, 
CD) 是 这 项 技术 的 第 一 个 实际 应 用 。 后 来 光学 技术 很 快 就 用 于 计算 机 环境 ， 以 提供 高 容量 的 只 
读 存 储 ， 被 称 为 只 读 光 盘 (CD-ROM). 

第 一 代 CD 在 20 世 纪 80 年 代 中 期 由 索尼 和 菲利普 公司 开发 出 来 ， 同 时 还 发 布 了 关于 这 些 设备 
的 完全 规范 。 这 个 技术 利用 了 可 以 使 用 数字 来 表示 模拟 声音 信号 的 可 能 性 。 为 了 提供 高 质量 的 
声音 记录 和 和 再现， 人 们 使 用 了 16 位 的 模拟 声音 信号 采样 ， 频 率 为 每 秒 采样 44 100 次 ， 这 个 采样 频 
率 是 原来 声音 最 高 频率 的 两 倍 ， 从 而 可 以 精确 地 重建 声音 。CD 可 以 保存 最 少 一 个 小 时 的 音乐 ， 
它 的 第 一 个 版 本 被 设计 成 可 以 保存 75 分 钟 的 音乐 ， 这 需要 大 约 3 x 10" (3G) 的 存储 量 。 从 那 以 
后 ， 更 高 容量 的 设备 被 开发 出 来 ， 一 张 视频 CD 可 以 存储 一 整 部 电影 ， 这 需要 的 存储 容量 比 音频 
CD 高 将 近 一 个 数量 级 。 多 媒体 CD 同样 适用 于 存储 大 量 的 计算 机 数据 。 

CD 技术 

用 于 CD 系统 的 光学 技术 以 激光 源 为 基础 。 一 个 激光 束 直射 到 旋转 的 盘面 上 ， 物 理 四 凸 沿 着 
光盘 轨道 排 布 ， 它 们 把 射 来 的 光束 反射 到 一 个 光电 探测 器 上 ， 用 它 来 探测 所 存 的 二 进 制 模式 。 

激光 器 发 出 一 东 相 关 光 ， 它 准确 地 聚焦 到 盘面 上 。 相 关 光 由 同步 的 波 组 成 ， 它 们 有 相同 的 
波长 。 一 束 相关 光 与 另 一 束 相同 类 别 的 相关 光 混 合 ， 如 果 这 两 东 光 同 相位 ， 那 么 会 产生 一 束 更 
亮 的 光 。 但 是 ， 如 果 这 两 束 光 相位 差 180 度 ， 那 么 它们 会 互相 抵消 。 因 此 ， 如 果 使 用 光电 探测 器 
来 探测 光束 ， 在 第 一 种 情况 下 它 会 探测 到 一 个 亮点 ， 在 第 二 种 情况 下 它 会 探测 到 一 个 暗 点 。 

图 5-32a 显 示 了 CD 一 小 部 分 的 横 切 面 。 最 底层 是 聚 碳酸 脂 塑料 ， 起 到 透明 盘 基 的 作用 。 塑 料 
表面 可 以 通过 刻 出 乌 痕 来 编程 存储 数据 ， 未 刻 的 部 分 称 为 驯 靖 。 然 后 在 已 编程 的 盘 上 禾 上 一 个 
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很 落 的 铝 反 射 层 ， 再 在 铝 反 射 层 外 包 上 一 个 丙烯 酸 保护 层 。 最 后 ， 最 外 层 被 印 上 标签 。 光 盘 的 
总 厚度 是 1.2 毫 米 ， 这 几乎 都 是 聚 碳 酸 脂 塑 料 ， 其 他 层 都 非常 薄 。 


fa AINAR 标签 





| 反射 





激光 源 探测 器 油光 源 探测 器 激光 源 探测 器 


b) 从 町 疫 到 凸 痕 的 转变 


010010000100010010010 
c) 存储 的 二 进 制 模式 
图 5-32 光盘 


激光 源 和 光电 探测 器 被 放 在 到 碳酸 脂 的 下 方 ， 发 出 的 光线 穿 过 塑料 ， 在 铝 反射 层 上 被 反射 回 
来 ， 然 后 向 回 传播 到 光电 探测 器 。 注 意 从 激光 这 边 来 看 ， 思 痕 相对 凸 痕 来 说 实际 上 是 一 个 凸 起 。 

图 5-32b 显 示 了 在 激光 束 治 着 盘面 扫描 并 遇 到 一 个 从 凹 痕 到 凸 痕 的 转变 时 发 生 的 情况 ， 图 中 
显示 了 激光 源 和 探测 器 的 三 个 不 同位 置 ， 它 们 随 着 光盘 的 转动 而 出 现 。 当 光 只 是 在 凹 痕 或 凸 痕 
上 反射 时 ， 探 测 器 将 会 看 到 反射 的 光 ， 它 会 看 到 一 个 亮点 。 但 是 当 光 线 移 过 从 凹 痕 变 成 凸 痕 的 
边 , 或 从 凸 痕 到 媚 痕 的 边 时 ， 就 会 发 生 不 同 的 情况 。 思 痕 四 进 光 的 波长 的 四 分 之 一 ， 因 此 从 思 
痕 反 射 的 波 与 从 凸 痕 反 射 的 波 相位 差 180 度 ， 它 们 互相 抵消 。 于 是 在 四 痕 -- 凸 痕 和 凸 痕 - 凹 痕 转 
换 处 探测 器 看 不 到 反射 的 光波 ， 它 将 探测 到 一 个 瞳 点 。 

图 5-32c 描 述 了 在 凸 痕 和 四 痕 之 间 的 一 些 转换 。 如 果 被 探测 为 暗 点 的 凹凸 转换 表示 二 进 制 什 
1， 平 的 部 分 表示 0， 那 么 探测 到 的 二 进 制 模式 就 如 图 所 示 。 这 个 模式 不 直接 表示 存储 的 数据 ， 
CD 使 用 一 个 复杂 的 编码 方案 来 表示 数据 。 每 字 节 数据 表示 成 14 位 编码 ， 它 提供 了 相当 强 的 错误 
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检测 能 力 。 我 们 不 再 详细 研究 这 个 编码 。 

蔬 痛 沿 着 盘面 上 的 轨道 排 布 。 实 际 上 只 有 一 条 物理 轨道 ， 它 从 盘 的 中 间 螺 旋 伸 展 到 外 边缘 。 
但 是 , 习惯 上 我 们 把 每 个 跨越 360 度 的 圆 形 路 径 看 作 一 个 单独 的 轨道 ， 这 与 磁盘 使 用 的 技术 类 似 。 
CD 的 直径 是 120 豪 米 ， 在 中 心 有 一 个 15 毫 米 的 孔 。 存 储 数 据 的 轨道 位 于 从 半径 25 毫 米 到 38 毫米 
的 区 域 中 。 扫 道 间 的 间隔 是 1.6 微 米 ， 凹 痕 0.5 微 米 宽 ，0.8 到 3 微米 长 。 一 张 盘 上 有 超过 15 000 个 
的 轨道 。 如 果 整 个 轨道 螺旋 全 部 展开 ， 它 的 长 度 将 超过 5 公里 。 

这 些 数字 表明 轨道 密度 约 为 6000 轨 道 /厘米 ， 它 比 磁盘 的 密度 要 高 得 多 。 硬 盘 轨 道 密度 的 范 
围 是 每 厘米 800 到 2000 个 轨道 ， 软 盘 每 厘米 轨道 数 少 于 40 个 。 

CD-ROM 

因为 信息 以 二 进 制 形式 存储 在 CD 上， 所 以 它们 也 适合 用 作 计 算 机 系统 的 存储 介质 。 最 大 的 
问题 是 如 何 保证 数据 的 完整 性 。 因 为 凹 痕 很 小 ， 所 以 很 难 完 全 正确 地 实现 每 一 个 凸 痕 。 在 音频 
和 视频 应 用 中 ， 一 些 错误 可 以 被 容忍 ， 因 为 它们 对 再 现 的 声音 和 图 像 产 生 的 影响 不 会 被 察觉 到 。 
然而 ， 这 样 的 错误 在 计算 机 应 用 中 是 不 可 接受 的 。 由 于 物理 上 的 缺陷 是 不 可 避免 的 ， 所 以 需要 
使 用 附加 的 位 来 提供 错误 检测 和 纠正 能 力 。 用 在 计算 机 应 用 中 的 CD 有 这 种 能 力 。 它 们 被 称 为 只 
读 光 盘 〈CD-ROM)， 因 为 在 制造 后 它们 的 内 容 就 只 能 被 读 取 ， 像 半导体 只 读 存储 器 芯片 一 样 。 

存储 的 数据 在 CD-ROM 的 轨道 上 按 块 的 形式 组 织 ， 这 些 块 称 为 扁 区 。 遍 区 有 几 种 不 同 的 格 
式 。 一 种 格式 称 为 模式 1， 它 使 用 2 352 字 节 的 块 。 每 个 块 有 一 个 16 字 节 的 头 ， 包 含 用 于 检测 扇 区 
起 点 的 同步 字段 和 用 于 标志 扇 区 的 地 址 信息 。 后 面 跟着 的 是 2 048 字 节 的 存储 数据 。 在 扇 区 结尾 
有 288 个 字 节 ， 用 于 实现 错误 纠正 方案 。 每 个 轨道 的 遍 区 数 各 不 相同 ， 较 长 的 外 侧 轨 道 有 更 多 的 
ME. 

错误 检测 和 纠正 在 多 个 层次 上 进行 。 就 像 在 介绍 CD 时 提 到 的 ， 每 个 字 节 的 存储 信息 使 用 14 
位 的 代码 来 编码 ， 它 有 -- 定 的 纠 错 能 力 ， 能 纠正 单个 位 的 错误 。 在 短期 脉冲 中 产生 的 错误 影响 
多 个 位 ， 这 可 以 使 用 遍 区 结尾 处 的 错误 检查 位 来 检测 和 纠正 。 

CD-ROM 驱 动 器 以 很 多 种 不 同 的 旋转 速度 工作 。 基 本 速度 称 为 1X， 是 每 秒 75 个 扇 区 ， 这 提 
供 了 153 600 字 节 / 秒 (150K 字 节 / 秒 ) 的 数据 传输 率 。 以 这 个 速度 和 格式 ， 使 用 存储 75 分 钟 音乐 
的 标准 光盘 的 CD-ROM 有 650M 字 节 的 存储 容量 。 注 意 ， 驱 动 器 速度 只 影响 数据 传输 率 ， 对 光盘 
的 存储 容量 没有 影响 。 更 高 速度 的 CD-ROM 驱 动 器 相对 基本 速度 标注 。 因 此 ， 一 个 40X 的 CD- 
ROM 的 数据 传输 率 比 1X 的 CD-ROM 高 40 倍 。 注 意 这 个 传输 速率 (<6M 字 节 / 秒 ) 要 比 硬 盘 的 传输 
速率 低 得 多 ,硬盘 的 传输 速率 在 每 秒 几 十 兆 的 范围 内 。 另 一 个 大 的 性 能 区 别 是 半 道 时 间 ， 在 CD- 
ROM 中 可 能 是 几 百 毫秒 。 所 以 ， 就 性 能 而 言 ，CD-ROM 显 然 要 劣 于 磁盘 ， 它 们 的 吸引 力 在 于 物 
理 尺 寸 小 ， 成 本 低 ， 还 有 容易 作为 可 拆 装 和 可 移动 的 海量 存储 介质 。 

CD-ROM 对 计算 机 系统 的 重要 性 是 因为 与 其 他 廉价 便携 介质 〈 例 如 软盘 和 了 磁带) 相 比 ， 它 
们 有 很 大 的 存储 容量 和 很 快 的 访问 速度 ， 因 此 广泛 应 用 于 软件 发 布 、 数 据 库 、 大 文本 (E) 
用 程序 和 视频 游戏 中 。 

可 刻录 CD 

前 面 描述 的 CD 是 只 读 的 设备 ， 信 息 使 用 特殊 的 过 程 存 储 。 首 先 ， 使 用 高 功率 激光 在 需要 四 
痕 的 位 置 烧 出 坑 ， 以 此 来 生产 一 个 母 盘 。 然 后 根据 母 盘 生产 一 个 模具 ， 它 在 有 坑 的 地 方 会 有 一 
个 凸 起 。 接 着 ， 把 熔化 的 聚 矶 酸 脂 塑料 注 和 模具， 就 可 以 生产 出 与 母 盘 凹 痕 模 式 相同 的 CD 了 。 
这 个 过 程 显然 只 适合 CD 的 批量 生产 。 
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20 世 纪 90 年 代 末年 有 一 种 新 类 型 的 CD 被 开发 出 来 ,计算机 用 户 可 以 很 容易 地 把 数据 刻 到 它 
上 面 ， 它 被 称 为 可 刻录 光盘 (CD-Recordable ，CD-R)。 在 生产 过 程 中 ， 在 光 担 上 做 出 了 一 条 螺 
旋 轨 道 。 在 CD-R 驱 动 器 中 使 用 激光 在 轨道 上 的 有 机 染料 上 烧 出 目 痕 来 ， 当 被 烧 的 点 加 热 到 一 定 
的 温度 时 ， 它 就 变 得 不 透明 了 。 在 以 后 读 的 上 时候， 这 个 点 反射 较 少 的 光 。 写 入 的 数据 被 永久 存 
储 ， 未 使 用 的 部 分 可 以 在 以 后 用 来 存储 其 他 数据 。 

可 擦 写 CD 

最 灵活 的 CD 是 那些 可 以 由 用 户 多 次 写 人 的 CD ， 它 们 被 称 为 可 擦 写 光 盘 (CD-ReWritable， 
CD-RW). 

CD-RW 的 基本 结构 与 CD-R 类 似 。 但 是 在 可 刻录 层 没 有 使 用 有 机 染料 ， 而 是 使 用 银 、 钢 、 饥 
和 磅 的 合金 。 这 种 合金 在 被 加 热 和 冷却 时 发 生 的 反应 非常 有 趣 ， 也 非常 有 用 。 如 果 它 被 加 热 到 
超过 熔点 〈500 摄 氏 度 ) 然后 被 冷却 ， 就 变 成 非 晶体 状态 ， 此 时 它 吸 收 光线 。 但 是 如 果 它 只 被 加 
热 到 200 摄 氏 度 ， 然 后 保持 一 段 时 间 ， 就 会 发 生 称 为 退火 的 过 程 ， 导 致 合金 变 成 晶体 状态 ， 此 时 
它 允 许 光线 穿 过 。 如 果 用 晶体 状态 来 表示 山 痕 区 域 ， 那 么 可 以 通过 把 选 定 点 加 热 到 超过 熔点 来 
创建 乞 痕 。 存 储 的 数据 可 以 使 用 退火 过 程 来 控 除 ， 这 使 合金 回 到 统一 的 晶体 状态 。 反 射 材料 放 
在 刻录 层 的 上 面 ， 在 盘 被 读 取 的 时 候 用 来 反光 。 

CD-RW 驱 动 器 使 用 三 种 不 同 功率 的 激光 。 最 高 功率 用 来 刻录 凹 痕 ; 中 等 功率 用 来 把 合金 变 
成 晶体 状态 ， 它 被 称 为 擦 除 功 率 ; 最 低 功率 用 来 读 取 存 储 的 数据 。CD-RW 光 盘 能 被 擦 写 的 次 数 
有 一 个 限制 ， 现 在 ， 这 个 次 数 可 以 达 1000 次 。 

CD-RW 驱 动 器 通常 也 能 处 理 其 他 光盘 介质 ， 它 能 读 取 CD-ROM， 能 读 写 CD-R。 它 按 标准 互 
连接 口 的 要 求 设计 ， 例 如 BIDE、SCSI 和 USB 。 | 
CD-RW 提 供 了 低 成 本 存储 介质 ， 它 适合 于 信息 档案 存储 ， 适 用 的 范围 可 以 从 数据 库 到 图 形 
图 像 。 也 可 以 用 于 信息 的 小 批量 发 布 ， 与 CD-R 一 样 。 现 在 CD-RW 驱 动 器 的 速度 已 经 足够 快 ， 可 
以 用 于 每 天 的 硬盘 备份 。CD-RW 技 术 已 经 使 得 CD-R 不 那么 重要 了 ， 因 为 它 以 稍 高 一 点 的 成 本 提 

供 了 非常 好 的 性 能 。 

DVD 技术 

CD 技术 的 成 功 和 对 更 大 存储 容量 的 不 断 寻 求 导 致 了 DVD (Digital Versatile Disk， 数 字 多 功 
能 光盘 ) 技术 的 发 展 。 第 一 个 DVD 标准 由 一 个 公司 联盟 在 1996 年 制定 ， 目 标 是 能 在 DVD 盘 的 -一 
面 上 存储 一 整 部 电影 。 

DVD 光 盘 的 物理 尺寸 与 CD 相同 ， 盘 体 1.2 毫 米 厚 ， 直 径 120 毫 米 。 通 过 改变 下 面 几 项 设计 使 
得 它 的 存储 容量 比 CD 高 得 多 : 

“ 使 用 波长 为 635nm 的 红色 激光 器 代替 CD 中 使 用 的 波长 为 780nm 的 红外 激光 器 。 波 长 的 缩短 

可 以 把 光线 府 焦 到 一 个 更 小 的 点 上 。 

*“ 凹 痕 更 小 ， 最 小 长 度 0.4 微 米 。 

“轨道 更 接近 ， 轨 道 间 距离 是 0.74 微 米 。 

使 用 了 这 些 改进 使 得 DVD 的 容量 有 4.7G 字 节 。 

使 用 两 层 或 两 面 的 盘 可 以 进一步 增加 容量 。 单 层 单 面 的 盘 是 在 DVD-5 标 准 中 定义 的 ， 它 的 
结构 与 图 5-32a 中 的 CD 几 平 一 样 。 双 层 盘 使 用 两 个 层 ， 每 层 都 刻 有 轨道 。 第 一 层 是 一 个 透明 的 盘 
基 ， 与 CD 得 一 样 。 但 是 它 没 有 用 铝 来 反射 ， 而 是 在 这 层 的 凹 痕 和 凸 痕 上 覆盖 一 层 半 透明 材料 ， 
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凹 痕 和 凸 痕 上 再 放 上 一 层 放射 材 料 。 这 种 盘 通 过 把 激光 束 聚 焦 到 需要 的 层 上 来 实现 读 取 。 当 激 
光 育 焦 到 第 一 个 层 上 ， 半 透明 材料 反射 回 足 够 的 光 来 检测 存储 的 二 进 制 模式 ; 当 激 光束 焦 到 第 
二 个 层 上 上， 反射 材料 返回 的 光 显 示 了 这 一 层 存 储 的 信息 。 在 两 种 情况 下 ， 没 有 被 激光 聚焦 的 层 
反射 回 少量 的 光 ， 它 被 探测 器 电路 当 作 噪声 排除 了 。 两 个 层 的 总 存储 容量 是 8.5G 字 节 ， 在 标准 
里 这 种 盘 称 为 DVD-9。 

两 个 单 面 盘 可 以 故 在 一 起 形成 一 个 类 似 三 明治 的 结构 ， 其 中 上 面 的 那 张 盘 要 翻 个 面 。 这 可 
以 使 用 单 层 盘 来 实现 ， 像 在 DVD-10 中 规定 的 ， 组 合成 的 盘 的 容量 是 9.4G 字 节 。 它 也 可 以 使 用 双 
层 盘 来 实现 ， 像 在 DVD-18 中 规定 的 ,产生 17G 的 存储 容量 。 

DVD 驱动 器 的 访问 时 间 与 CD 驱动 器 相似 ， 但 是 ， 由 于 DVD 盘 以 相同 的 速度 旋转 ， 而 它 的 叫 
痕 密 度 更 高 ， 所 以 它 的 数据 传输 率 要 高 得 多 。 

DVD-RAM 

人 们 还 开发 出 了 一 个 DVD 设 备 的 可 擦 写 版 本 ， 称 为 DVD-RAM， 它 提供 了 很 大 的 存储 容量 。 
仅 有 的 缺点 是 高 价格 和 相对 来 说 较 慢 的 写 速 度 。 为 了 保证 信息 正确 地 记录 在 光盘 上 ， 人 们 使 用 
了 一 个 称 为 写 验证 的 过 程 。 这 个 过 程 是 由 DVD-RAM 驱 动 器 完成 的 ， 它 读 取 存 储 的 内 容 ， 然 后 
把 它 与 原始 数据 进行 校对 。 


5.9.3 磁带 系统 


磁带 适合 用 于 大 量 数据 的 离线 存储 ， 它 们 通常 用 于 硬盘 备份 和 归档 存储 。 磁 带 记 录 时 使 用 
了 与 磁盘 相同 的 原理 ， 主 要 的 区 别 是 磁带 的 磁性 薄膜 镀 在 一 条 很 细 的 宽度 为 0.5 到 0.25 英 寸 的 塑 
料 带 上 。 在 磁带 的 宽度 方向 上 平行 记录 了 7 到 9 位 (对 应 一 个 字符 ) ， 它 与 磁带 的 运动 方向 垂直 。 
磁带 每 个 位 的 位 置 都 有 一 个 单独 的 读 写 磁头 ， 所 以 一 个 字符 的 所 有 位 能 并 行 读 或 写 。 字 符 的 一 
个 位 用 作 奇 偶 位 。 

磁带 上 的 数据 按 记 录 的 形式 组 织 ， 记 录 由 间隙 分 开 ， 如 图 5-33 所 示 。 磁 带 的 运动 只 有 在 记 
录 间 承 位 于 读 写 磁头 下 方 时 才 会 停止 。 记 录 的 间 路 足够 长 ， 双 许 磁 带 在 到 达 下 一 个 记录 的 起 点 
之 前 能 达到 正常 速度 。 如 果 使 用 类 似 图 5-29c 中 的 编码 方案 在 磁带 上 记录 数据 ， 那 么 记录 间 辽 可 
以 表示 为 没有 磁性 变化 的 区 域 。 这 允许 记录 间隙 的 检测 独立 于 存储 的 数据 。 为 了 帮助 用 户 组 织 
大 量 数据 ， 把 一 组 相关 的 记录 称 为 文件 。 文 件 的 起 点 通过 文件 标记 来 识别 ， 如 图 5-33 所 示 。 文 
件 标记 是 一 个 特殊 的 单字 符 或 多 字符 记录 ， 它 前 面 通常 有 一 个 比 记 录 间 间隙 长 一 些 的 间隙 。 文 
件 标记 后 的 第 一 个 记录 可 以 用 作 这 个 文件 的 文件 头 或 文件 标志 符 ， 这 人 允许 用 户 在 包含 大 量 文件 
的 磁带 中 搜索 特定 的 文件 。 


文件 


文件 | 








图 5-33 磁带 上 的 数据 组 织 结构 
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磁带 驱动 器 的 控制 器 除了 能 执行 读 写 命令 ;还 能 执行 很 多 其 他 的 控制 命令 。 控 制 命令 包括 
以 下 的 操作 : 

* 回 着 磁带 

。 回 卷 并 印 载 磁带 

。 擦 除 磁带 

* 写 磁带 标记 

“ 前进 一 个 记录 

“ 后退 一 个 记录 

* 前进 一 个 文件 

“后 退 一 个 文件 

在 “ 写 磁带 标记 ”操作 中 的 磁带 标记 与 文件 标记 类 似 ， 只 是 它 是 用 来 标记 磁带 起 点 的 。 磁 
带 结尾 有 财 候 使 用 EOT 字 符 来 标记 〈 见 附 录 E)。 

有 两 种 格式 化 磁带 和 使 用 磁带 的 方法 。 在 第 一 种 方法 中 ， 记 录 的 长 度 是 变化 的 ， 这 可 以 有 
效 地 使 用 磁带 ， 但 是 它 不 能 更 新 和 覆盖 指定 位 置 的 记录 。 第 二 种 方法 使 用 固定 长 度 的 记录 ， 这 
样 它 就 允许 更 新 指定 的 记录 。 虽 然 这 可 能 看 起 来 非常 好 ， 但 是 实际 上 并 没有 那么 重要 。 磁 带 最 
通常 的 用 途 是 备份 硬盘 信息 和 对 数据 归档 存储 ， 在 这 些 应 用 中 ， 磁 带 都 是 从 头号 到 尾 ， 所 以 记 
录 的 大 小 无 关 紧 要 。 

合式 磁带 系统 

磁带 系统 已 经 被 开发 用 来 为 在 线 磁盘 存储 做 备份 。 其 中 有 一 种 这 样 的 系统 使 用 8 毫米 视频 格 
式 磁 带 ， 磁 带 位 于 一 个 盒 中 。 这 种 部 件 称 为 盒 式 磁带 ， 它 们 的 存储 容量 为 2G 到 5G 字 节 ， 能 以 每 
秘 几 百 K 的 速度 传输 数据 。 通 过 一 个 螺旋 扫描 系统 横 跨 磁带 进行 操作 来 实现 读 写 ， 这 与 盒 式 录像 
带 驱 动 器 类 似 。 位 密度 能 达到 每 平方 英寸 几 千 万 比特 。 现 在 已 经 有 能 自动 装 念 和 人 卸 盒 的 多 盒 系 
统 ， 所 以 数 十 G 的 在 线 存 储备 份 可 以 不 需要 人 来 干涉 。 
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在 任何 一 种 计算 机 中 存储 器 都 是 一 个 主要 的 部 件 ， 它 的 容量 和 速度 在 决定 计算 机 性 能 时 起 
重要 作用 。 在 这 一 章 中 ， 我 们 介绍 了 存储 器 设计 中 最 重要 的 技术 和 组 织 结构 细节 。 

半导体 技术 的 发 展 使 得 存储 器 芯片 的 速度 和 容量 有 了 很 大 的 提高 ， 每 位 成 本 也 大 幅 下 降 。 
但 是 处 理 器 芯片 的 发 展 更 显著 ,特别 是 处 理 器 芯片 处 理 速度 的 提高 使 它 的 速度 已 经 超过 了 存储 
器 的 速度 。 为 了 充分 利用 现代 处 理 器 的 能 力 ， 计 算 机 必须 拥有 很 大 而 且 很 快 的 存储 器 。 由 于 成 
本 同样 也 很 重要 ， 所 以 存储 器 不 能 只 是 简单 地 使 用 快速 的 静态 随机 存储 器 来 设计 。 就 像 我 们 在 
这 章 中 看 到 的 那样 ， 这 个 问题 的 解决 方案 是 使 用 存储 器 层次 结构 。 

今天 ， 可 以 提供 的 大 容量 主 存 都 是 使 用 动态 存储 器 芯片 实现 的 ， 这 样 的 存储 器 就 时 钟 周期 
而 言 可 能 比 快速 的 处 理 器 慢 一 个 数量 级 ， 这 需要 使 用 一 个 SRAM 高 速 缓存 来 减 小 处 理 器 感受 到 
的 有 效 存储 器 访问 时 间 。 存 储 器 延迟 是 决定 计算 机 性 能 的 一 个 重要 参数 ， 大 量 的 研究 工作 都 集 
中 到 开发 用 于 最 小 化 存储 器 延迟 的 方案 上 。 我 们 描述 了 写 缓冲 区 和 预 取 技 术 如 何 减少 了 延迟 的 
影响 ， 它 们 在 不 需要 执行 高 优先 级 存储 器 访问 (由 读 失 效 引 起 ) 时 可 以 执行 紧急 特性 低 一 些 的 
访问。 如果 同 时 访问 一 块 连续 字 节 ， 那 么 存储 器 延迟 的 影响 还 能 碱 小 ， 新 型 的 存储 器 芯片 正 是 
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利用 了 这 个 特点 进行 开发 。 

磁盘 或 光盘 形式 的 辅助 存储 设备 提供 了 层次 结构 中 最 大 的 存储 容量 。 虚 拟 存储 器 机 制 在 磁 
盘 和 主 存 之 间 建 立 了 对 用 户 透明 的 交互 。 对 虚拟 存储 器 的 硬件 支持 已 经 成 为 现代 处 理 器 的 标准 
特征 。 

磁盘 是 计算 机 技术 进步 的 一 个 很 有 意义 的 例子 。 它 们 通常 是 存储 器 层次 结构 中 的 低速 部 分 。 
在 不 同时 期 ， 当 新 技术 出 现 并 有 很 好 的 发 展 前 景 时 ， 磁 盘 继 续 存 在 的 价值 就 会 受到 置疑 。 在 20 
世纪 80 年 代 早期 ,“ 磁 泡 ” 存 储 器 似 平 会 造成 很 大 威胁 ， 而 近年 来 的 竞争 者 是 闪存 驱动 器 和 光盘 。 
但 是 ， 磁 盘 技术 不 但 没有 被 遗弃 ， 反 而 不 断 发 展 。 磁 盘 驱 动 器 的 容量 不 断 变 大 ， 物 理 尺 寸 不 断 
变 小 ， 而 且 每 个 存储 位 的 成 本 也 不 断 降低 。 


习题 


51 对 于 一 个 使 用 512K x 8 存储 器 芯片 的 8M x 32 存 储 器 ， 给 出 它 的 类 似 图 5-10 的 框图 。 

52 考虑 图 5-6 中 的 动态 存储 器 单元 。 假 设 C = 50 飞 法 (10-' 法 )， 通 过 晶体 管 的 泄漏 电流 大 约 是 
9 皮 安 (10- 中安 )， 电 容器 充满 电荷 的 时 候 电压 为 4.5 伏 。 这 个 单元 必须 在 电压 降 到 3 伏 之 前 
进行 刷新 。 估 算 最 小 刷新 率 。 

53 在 图 5-8 的 右 下 角 有 数据 输入 和 数据 输出 寄存 器 。 画 出 能 实现 每 个 寄存 器 中 一 一 位 的 电路 ,并 

显示 出 它 到 一 侧 的 “ 读 / 写 电路 和 锁 存 器 ” 块 和 到 另 一 侧 的 数据 总 线 所 需要 的 连接 。 

54 考虑 由 SDRAM 芯 片 构成 的 主 存 ， 对 芯片 的 时 序 要 求 与 图 $-9 所 示 的 基本 一 致 ， 只 是 脉冲 长 度 
为 8。 假 设 并 行 传输 32 位 数据 ， 如 果 使 用 133MHz 的 时 钟 ， 传 输 下 面 数据 需要 多 少时 间 : 

(a) 32 字 节 数 据 
(b) 64 字 节 数 据 
每 个 高 速 缓存 的 延迟 是 多 少 ? 

55 分 析 下 面 这 句 话 为 什么 不 对 : “使 用 更 快 的 处 理 器 芯片 可 以 相应 地 提高 计算 机 的 性 能 ， 尽 管 
主 存 的 速度 保持 不 变 。” 

5.6 





9 一 般 结 构 在 图 
P5-1 中 给 出 ， 图 中 十 进 制 的 地 址 显示 了 两 个 循环 的 位 置 和 整个 程序 的 起 点 和 终点 ， 在 存储 器 
不 同 部 分 (17- 22、23 - 164、165 - 239 等 ) 的 所 有 位 置 都 包含 顺序 执行 的 指令 序列 。 这 个 
程序 运行 在 按 直 接 映射 方法 组 织 指令 高 速 缓存 的 计算 机 上 ， 并 且 各 个 参数 如 下 : 


主 存 大 小 64K 字 
高 速 缓 存 大 小 ”1K 字 
块 大 小 128 个 字 


主 存 的 周期 时 间 是 105s， 高 速 缓存 的 周期 时 间 是 1rs。 
(a) 在 主 存 地 址 中 指定 TAG、BLOCK 和 WORD 字 段 的 位 数 。 
(b) 计算 在 图 P5-1 中 的 程序 的 执行 期 间 取 指令 需要 的 总 时 间 。 

5.7 一 个 计算 机 在 主 存 和 处 理 器 之 间 使 用 一 个 小 的 直接 映射 高 速 缓 在。 高速 缓存 有 4 个 16 位 字 ， 
每 个 字 有 一 个 相 联 的 13 位 的 标志 ， 如 图 P5-2a 所 示 。 当 读 操作 期 间 发 生 一 次 失效 时 ， 把 请 求 
的 字 从 主 存 读 出 ， 然 后 送 到 处 理 器 。 同 时 它 被 拷贝 到 高 速 缓存 中 ， 并 且 其 块 号 被 存 到 相 联 
的 标志 中 。 考 虑 下 面 程序 中 的 循环 ， 其 中 所 有 的 指令 和 操作 数 都 是 16 位 长 。 
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165 
内 部 循环 | 外 部 循环 
| MITO f 执行 10 次 


END 1500 


图 P5-1 习题 5.6 的 程序 结构 


LOOP Add (R1) +, RO 
Decrement R2 
BNE LOOP 


假设 在 进入 循环 前 ， 寄 存 器 RO0、R1 和 R2 包 含 的 内 容 分 别 为 0、054E 和 3。 再 假设 主 存 中 包含 
图 P5-2b 所 示 的 数据 ， 其 中 所 有 的 入 口 都 以 16 进 制 给 出 。 循 环 在 LOOP=02EC 处 开始 。 

(a) 显示 每 执行 完 一 次 循环 后 高 速 缓 存 中 的 内 容 。 

(b) 假设 主 存 访问 时 间 是 10r， 高 速 缓存 是 1r， 计 算 每 次 循环 的 执行 时 间 。 不 考虑 在 存储 器 周 
期 间 处 理 器 耗费 的 时 间 。 
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a) 高 速 缓存 b) 主 存 


图 P5-2 习题 5.7 中 高 速 缓存 和 主 存 中 的 内 容 


重复 题 5.7， 假 设 在 高 速 缓存 中 只 存 一 条 指令 ， 数 据 操 作 数 直接 从 主 存 中 获取 ， 并 且 不 拷贝 
到 高 速 缓 在 中 。 为 什么 这 种 选择 比 把 指令 和 数据 都 写 到 高 速 缓存 中 速度 更 快 ? 

一 个 组 相 联 高 速 缓存 包含 64 个 块 ， 每 组 4 块 。 主 存 有 4096 个 块 ， 每 个 块 有 128 个 字 。 

(a) 主 存 地 址 有 多 少 位 ? 

(b) 在 每 个 TAG、SET 和 WORD 字 段 中 各 有 多 少 位 ? 


5.10 一 个 计算 机 系统 的 主 存 由 1M16 位 字 组 成 ， 它 还 有 4K 字 的 高 速 缓存 ， 按 组 相 联 组 织 ， 每 组 4 


个 块 ， 每 块 64 个 字 。 
(a) 计算 每 个 主 存 地 址 的 TAG、SET 和 WORD 字 段 的 位 数 。 
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(b) 假设 高 速 缓存 初始 为 空 ， 处 理 器 按 顺 序 从 位 置 0、1、2、…、4351 取 4352 个 字 ， 然 后 它 
再 重复 这 个 取 操 作 序列 9 次 。 如 果 高 速 缓 在 比 主 存 快 十 倍 ， 估 算 使 用 高 速 缓存 后 性 能 提高 
的 倍数 。 假 设 在 块 替换 时 使 用 LRU 算 法 。 
假设 只 要 从 主 存 中 读 出 一 个 新 块 且 它 在 高 速 缓存 中 对 应 的 组 已 经 满 了 ， 新 块 就 替换 这 个 组 
中 最 近 使 用 的 块 。 现 在 重复 题 5.10。 
5.5.3 节 用 图 5-19 中 的 程序 描述 了 不 同 高 速 缓存 映射 技术 的 效果 。 假 设 这 个 程序 的 第 二 个 循 
环 处 理 元 素 的 顺序 改 成 与 第 一 个 循环 相同 ， 也 就 是 使 用 如 下 语句 控制 第 二 个 循环 
for i : = 0 to 9 do 
推算 出 图 5-20 到 图 5-22 针 对 这 个 程序 的 等 式 。 从 此 可 以 得 出 什么 结 
一 个 字 书 可 编 址 的 计算 机 有 个 能 容纳 8 个 32 位 字 的 小 上 据 丰 过 级 每 个 高 速 缓存 块 有 1 
个 字 。 当 执行 一 个 给 定 的 程序 的 时 候 ， 处 理 器 按 下列 地 址 顺序 读 取 数 据 : 
200, 204, 208, 20C, 2F4, 2F0, 200, 204, 218, 21C, 24C, 2F4 
这 个 模式 重复 四 遍 。 
(a) 如 果 使 用 直接 映射 方式 ， 显 示 每 次 循环 结束 时 高 速 缓 存 中 的 内 容 。 计 算 这 个 例子 的 命中 
率 。 假 设 高 速 缓存 初始 为 空 。 
(b) 如 果 换 成 采用 LRU 禁 换算 法 的 相 联 映射 高 速 缓 存 ， 重 复 第 一 问 。 
(c) 如 果 是 4 路 组 相 联 高 速 缓存 ， 重 复 第 一 问 。 
假设 每 个 高 速 缓存 块 包含 两 个 32 位 字 ， 重 复 题 5.13。 在 第 三 问 中 ， 使 用 2 路 组 相 联 高 速 缓存 。 
在 图 5-25b 中 的 交叉 存储 器 系统 中 ， 在 设计 这 个 系统 的 高 速 缓存 时 ，K 值 是 如 何 影响 块 大 小 的 ? 
在 很 多 计算 机 中 ， 高 速 缓 存 块 的 大 小 在 32 字 节 到 128 字 节 之 间 的 范围 内 。 使 用 更 大 或 更 小 
的 高 速 缓存 块 的 主要 优点 和 缺点 各 是 什么 ? 
RATANA VEER NINAR, 使 用 类 似 于 5.6.2 节 中 的 计算 来 估计 块 大 小 为 16 个 字 、 
字 和 4 个 字 时 性 能 的 提高 。 假 设 所 有 被 装 入 的 字 至 少 被 处 理 器 访问 一 次 。 
要 设计 算 机 有 1 和 [2 天台 站 就 像 5.6.3 节 中 讨论 的 一 样 ， 高 速 缓存 块 由 8 个 字 组 成 。 假 
设 两 个 高 速 缓存 的 命中 率 一 样 ， 都 是 指令 为 0.95， 数 据 为 0.90， 再 假设 在 这 两 个 高 速 缓存 中 
访问 一 个 8 个 字 的 块 需 要 的 时 间 分 别 为 C,= 1 周期 和 C:= 10 周 期 。 
(a) 如 果 主 存 使 用 交叉 ， 那么 处 理 器 感受 到 的 平均 访问 时 间 是 多 少 ? 假设 存储 器 访问 使 用 与 
5.6.1 节 中 一 样 的 参数 。 
(b) 如 果 主 存 不 交叉 ， 平 均 访 问 时 间 是 多 少 ? 
(c) 交叉 获得 的 性 能 提高 为 多 少 ? 
假设 每 个 高 速 缓存 块 有 4 个 字 ， 重 复 题 5.18。 假 设 L2 高 速 缓存 使 用 SRAM 芯 片 实现 ， 为 Cx 估 
计 一 个 合理 的 值 。 
考虑 下 面 对 高 速 缓存 概念 的 类 比 。 一 个 修理 员 到 一 个 住宅 修理 加 热 系 统 。 他 带 了 一 个 工具 
箱 ， 里 面 有 他 最 近 在 类 似 工作 中 使 用 的 工具 。 他 反复 使 用 这 些 工具 ， 直 到 需要 另 一 个 工具 。 
可 能 在 屋外 的 卡车 上 有 他 需要 的 工具 ， 如 果 卡 车 上 没有 ， 他 就 必须 回 店铺 中 去 拿 。 
假设 我 们 把 工具 箱 、 卡 车 和 店铺 对 应 成 LI 高 速 缓存 、 2 高速 缓存 和 计算 机 主 存 ， 那 么 这 个 
类 比 是 否 恰当 ? 讨论 它 正确 和 不 正确 的 地 方 。 
一 个 由 32 位 数字 组 成 的 1024 x 1024 数 组 按 以 下 方法 标准 化 。 对 每 一 列 ， 找 到 最 大 的 元 素 ， 
这 个 列 中 的 所 有 元 素 除 以 这 个 最 大 元 素 。 假 设 虚拟 存储 器 中 每 页 包含 4K 字 节 ， 并 且 在 这 个 
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计算 中 主 存 的 1M 字 池 被 分 配 用 来 存储 数据 。 假 定 当 发 生 页 故障 时 从 磁盘 装载 一 个 页 到 主 存 
需要 40 毫 秒 。 

(a) 如 果 数 组 元 素 按 列 顺序 存储 在 虚拟 存储 器 中 ， 会 发 生 多 少 次 页 故障 ? 

(b) 如 果 元 素 按 行 顺序 存储 会 发 生 多 少 次 页 故障 ? 

(c) 对 于 (a) 和 (b) 中 的 布局 估算 标准 化 过 程 总 共 需 要 多 少时 间 。 

考虑 一 个 计算 机 系统 ， 它 物理 内 存 的 可 用 页 在 几 个 应 用 程序 中 分 配 。 当 分 配给 一 个 程序 的 
所 有 页 都 满 了 ， 而 且 需 要 一 个 新 页 时 ， 新 页 必须 替换 出 一 个 已 经 存在 的 页 。 操 作 系 统 监 视 
页 传送 活动 并 动态 调整 对 不 同 程序 的 页 分 配 。 给 出 一 个 能 被 操作 系统 用 来 最 小 化 的 总 体 页 
传送 率 的 合适 策略 。 

在 一 个 有 虚拟 存储 器 的 计算 机 中 ， 一 条 指令 的 执行 可 能 被 页 故障 中 断 。 为 了 能 使 指令 在 以 
后 继续 执行 ， 需 要 保存 哪些 状态 信息 ?注意 把 一 个 新 页 装 和 人 主 存 涉 及 DMA 传 输 ， 它 需要 执 
行 其 他 指令 。 放 弃 被 中 断 的 指令 ， 然 后 把 它 完全 重新 执行 一 遍 是 否 更 简单 ?重新 执行 一 遍 
能 实现 吗 ? 

当 一 个 程序 产生 一 个 对 不 在 物理 主 存 中 的 页 引用 时 ， 这 个 程序 的 执行 被 挂 起 ， 直 到 请 求 的 
页 被 装 入 主 存 。 当 一 个 页 中 指令 的 操作 数 在 另 一 个 页 中 时 ， 会 有 什么 困难 发 生 ? 为 了 处 理 
这 种 情况 ， 处 理 器 必须 拥有 何 种 能 力 ? 

一 个 磁盘 部 件 有 24 个 记录 面 ， 它 共有 14 000 个 柱 ， 平 均 每 个 克 带 有 400 个 扇 区 ， 每 个 记 区 包 
含 512 字 节 的 数据 。 

(a) 这 个 磁盘 最 多 能 存储 多 少 字 节 ? 

(b) 以 7200rpm 的 速度 旋转 时 ， 数 据 传输 率 是 每 秒 多 少 字 节 ? 

(c) 假设 每 个 扁 区 有 512 字 节 ， 如 果 使 用 32 位 的 字 ， 给 出 一 个 指定 磁盘 地 址 的 合理 方案 。 

对 多 数 磁盘 传输 来 说 ， 在 磁盘 上 访问 特定 的 数据 块 时 ， 寻 道 时 间 加 上 旋转 延迟 通常 比 数据 
传送 周期 长 得 多 。 考 虑 对 在 5.9.1 节 中 作为 例子 给 出 的 3.5 英 寸 磁盘 的 连续 多 次 访问 ， 不 论 是 
读 操作 还 是 写 操作 ， 访 问 的 块 的 平均 长 度 都 是 8K 字 节 。 

(a) 假设 这 些 块 随机 分 布 在 磁盘 上 ， 估 算 寻 道 时 间 和 旋转 延迟 占 总 时 间 的 平均 百分比 。 

(b) 重新 排列 这 些 磁 盘 访 问 ， 使 得 在 90% 的 情况 中 下 一 次 访问 的 数据 块 与 这 次 访问 的 数据 
块 在 同一 个 柱 上 。 在 这 种 情况 下 重复 第 一 问 。 

磁盘 系统 的 平均 寻 道 时 间 和 旋转 延迟 分 别 是 6ms 和 3ms， 向 或 从 磁盘 传输 数据 的 速率 是 每 秒 
30M 字 节 ， 并 且 所 有 的 磁盘 访问 都 是 对 8K 字 节 数 据 的 访问 。 磁 盘 DMA 控 制 器 、 处 理 器 和 主 存 
都 连 到 一 个 单一 的 总 线 上 ， 总 线 数据 宽度 为 32 位 ， 向 或 从 主 存 的 一 次 总 线 传输 花费 10 纳 秒 。 
(a) 能 同时 向 或 从 主 存 传输 数据 的 磁盘 部 件 的 最 大 数目 是 多 少 ? 

(b) 在 一 个 长 时 间 段 内 有 一 系列 独立 的 8K 字 节 传 输 发 生 ， 在 这 段 时 间 内 平均 有 百 分 之 几 的 
主 存 周期 被 磁盘 部 件 窃取 ? 

假定 在 虚拟 存储 器 系统 中 用 磁盘 作为 辅助 存储 设备 ， 用 来 存储 程序 和 数据 文件 ， 哪 一 种 磁 
盘 参 数 将 对 页 大 小 的 选择 产生 影响 ? 


一 个 磁带 驱动 器 有 以 下 参数 : 
位 密度 2000bits/cm 
磁带 速度 800cm/s 


翻转 运动 方向 的 时 间 225ms 
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在 记录 间 间 阶 上 花费 的 最 短 时 间 3ms 
平均 记录 长 度 4000 个 字符 
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如 果 它 具有 在 前 进 和 后 退 两 个 方向 上 读 取 记 录 的 能 力 ， 佑 算 这 个 能 力 使 得 时 间 缩 短 的 百 分 
比 是 多 少 。 假 设 记录 被 随机 访问 ， 连 续 两 次 访问 的 两 条 记录 间 的 平均 距离 是 4 条 记录 。 





本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

“使 用 超前 进位 逻辑 同步 产生 进位 信号 且 以 层次 结构 实现 的 高 速 加 法 器 
“Booth 算 法 ， 用 来 在 有 符号 数 乘法 中 根据 乘 数 的 位 模式 选择 被 乘 数 求 和 项 
“ 高 速 乘法 器 ， 使 用 进位 保留 加 法 并 行 加 入 求 和 项 

* 除法 运算 电路 

* 浮 点 数 的 三 EE 标 准 表示 形式 以 及 浮 点 数 的 基本 算术 运算 


所 有 数字 计算 机 的 基本 运算 操作 都 是 两 个 数 的 加 和 减 。 算 术 运 算 属于 机 器 指令 层次 。 与 第 1 
章 讲述 的 基本 逻辑 功能 ， 比 如 AND、OR、NOT 及 XOR ( 异 或 ) 相同 ， 算 术 运 算 也 在 处 理 器 的 算 
REH (ALU) 子 系统 中 实现 。 本 章 将 介绍 实现 算术 运算 的 逻辑 电路 。 执 行 加 法 操作 所 需 
要 的 时 间 会 影响 处 理 器 的 性 能 。 与 加 减 操作 相 比 ， 乘 除 操作 需要 更 复杂 的 电路 ， 并 且 也 会 影响 
处 理 器 的 性 能 。 我 们 将 介绍 几 种 现代 计算 机 使 用 的 进行 高 速算 术 运 算 的 技术 。 

与 算术 运算 相 比 ， 逻 辑 运算 很 容易 使 用 组 合 电路 实现 。 它 们 只 需要 在 操作 数 的 每 一 位 上 进 
行 独立 的 布尔 运算 ， 而 算术 运算 则 还 需要 进位 / 借 位 等 辅助 信号 。 

我 们 在 2.1 节 中 描述 了 有 符号 二 进 制 数 的 表示 ， 还 指出 了 对 于 执行 加 减 运算 来 说 ， 补 码 是 最 
好 的 表示 方法 。 在 图 2-4 的 例子 中 我 们 看 到 ， 两 个 ”位 有 符号 数 可 以 使 用 位 二 进 制 加 法 相 加 ， 
将 符号 位 用 与 其 他 位 一 样 的 方法 进行 处 理 。 换 句 话说， 计算 无 符号 二 进 制 数 加 法 的 逻辑 电路 也 
可 以 用 来 计算 补 码 表 示 的 有 符号 数 的 加 法 。 如 果 没 有 溢出 ， 则 加 法 的 和 是 正确 的 ， 且 可 以 忽略 
任何 进位 输出 。 本 章 的 前 两 节 将 介绍 加 法 与 减法 的 逻辑 电路 网 络 。 


6.1 有 符号 数 加 减法 


图 6-1 显 示 了 将 两 个 数 X、Y 中 同等 权重 的 两 位 x、y; 相 加 时 ， 求 和 函数 与 进位 输出 函数 的 罗 
辑 真 值 表 。 图 中 还 列 出 了 这 两 个 函数 的 逻辑 表达 式 ， 以 及 两 个 4 位 无 符号 数 7 和 6 相 加 的 例子 。 请 
注意 加 法 过 程 中 的 每 一 步 都 必须 包含 一 个 进位 输入 位 。 我 们 用 ci 表示 第 i 步 的 进位 输入 ， 同 时 它 
EEZ G- 1D 步 的 进位 输出 。 

图 6-1 中 s; 的 逻辑 表达 式 可 以 用 三 输入 端 异 或 门 实现 ， 在 图 6-2a 中 它 是 单 步 二 进 制 加 法 所 需 
逻辑 的 一 部 分 。 进 位 输出 函数 c; "， 使 用 两 级 与 -或 逻辑 电路 实现 。 图 中 还 使 用 了 一 个 方便 的 符 
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号 一 一 会 加 器 (full adder, FA) 来 表示 单 步 加 法 所 需 的 全 部 逻辑 电路 。 

图 6-2b 显 示 了 7 个 全 加 器 部 件 的 级 联 ， 可 以 用 来 计算 两 个 位 数 的 加 法 。 由 于 进位 要 在 级 联 
中 传递 或 波动 ， 这 种 结构 被 称 为 n 位 行 波 进位 加 法 器 。 

最 低 有 效 位 (least-significant-bit，LSB ) 位 置 上 的 进位 输入 co 提供 了 为 数字 加 1 的 简单 方法 。 
例如 ， 得 到 一 个 数 的 补 码 需 要 对 该 数 的 反 码 加 1。 也 可 以 通过 进位 信号 将 个 加 法 器 互 连 ， 从 而 
形成 可 以 处 理 kn 位 输入 数字 的 加 法 器 ， 如 图 6-2c 所 示 。 
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图 6-1 单 步 二 进 制 加 法 的 逻辑 说 明 
加 法 /减法 逻辑 单元 


图 6-2b 中 的 "位 加 法 器 可 以 计算 补 码 数 X、7 的 加 法 ， 其 中 x -与 mm_! 位 为 符号 位 。 这 时 ， 进 
位 输出 位 cv 并 不 是 加 法 结果 的 一 部 分 。2.1.4 节 讨论 了 算术 证 出 。 只 有 当 两 个 操作 数 的 符号 相同 
时 溢出 才 可 能 发 生 。 这 时 如 果 计 算 结 果 的 符号 改变 ， 则 表明 是 发 生 了 溢出 。 因 此 ， 可 以 为 mn 位 加 
法 器 添加 执行 以 下 逻辑 表达 式 的 溢出 检测 电路 : 
溢出 = x, y, Saa Xa Yrs, 

还 可 以 证 明 当 进位 位 cv 与 c.- ! 不 同时 就 发 生 了 溢出 (参见 习题 6.9)。 因 此 ， 使 用 一 个 异 或 门 执行 
表达 式 cs @cs-1 就 可 以 得 到 更 简单 的 溢出 检测 电路 。 

为 了 执行 补 码 数 X 与 7 的 减法 操作 ，、 我 们 先 得 到 7 的 补 码 并 将 其 与 X 相 加 。 图 6-3 所 示 的 逻辑 电 
路 网 络 可 以 根据 加 法 /减法 输入 控制 线 的 值 执行 加 法 或 减法 操作 。 执 行 加 法 时 控制 线 置 0， 将 了 向 
量 不 加 改变 地 送 至 加 法 器 的 一 个 输入 端 ， 并 使 进位 输入 信号 co 为 0。 当 加 / 减 控制 线 置 1 时 ，7 向 
量 通过 异 或 门 形成 反 码 〈 即 按 位 取 反 )， 并 且 co 置 1 从 而 得 到 7Y 的 补 码 。 记 住 ， 负 数 补 码 的 计算 方 
法 与 正 数 是 完全 相同 的 。 可 以 在 图 6-3 中 添加 一 个 异 或 门 来 检测 溢出 条 件 c Dcr. 
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图 6-3 二 进 制 加 法 -减法 逻辑 网 络 
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6.2 快速 加 法 器 设计 


如 果 图 6-3 中 的 加 法 /减法 部 件 使 用 n 位 的 行 波 进位 加 法 器 ， 可 能 需要 经 历 很 长 的 延迟 才能 得 
到 输出 so 至 s,-! 以 及 cw。 这 个 延迟 是 否 可 以 被 接受 只 取决 于 其 他 处 理 器 部 件 的 速度 、 寄 存 器 和 高 
速 缓存 的 数据 传输 时 间 的 要 求 。 一 个 逻辑 门 电路 所 需 的 延迟 依赖 于 构造 该 电路 的 集成 电路 的 电 
子 工 艺 ( 见 附录 A)， 以 及 从 输入 至 输出 所 经 历 的 逻辑 门 的 数目 。 通 过 任何 一 个 以 特定 工艺 制造 
的 门 构成 的 组 合 逻 辑 网 络 所 需 的 延迟 ， 是 该 网 络 中 最 长 信号 传输 路 径 上 所 有 逻辑 门 延迟 的 总 和 。 
对 于 n 位 行 波 进 位 加 法 器 ， 最 长 路 径 是 从 最 低 有 效 位 LSB 位 置 上 的 输入 Xo、yo 及 co 到 最 高 有 效 位 
(most-significant-bit, MSB) 位 置 上 的 输出 cv 与 si。 

使 用 图 6-2a 所 示 的 逻辑 实现 ，c -: 在 2 (n -1) 个 门 延迟 后 得 到 ，w%- 需要 再 经 过 一 个 异 或 门 延 
迟 才 正 确 。 而 最 终 的 进位 输出 c, 需要 经 历 27 个 门 延迟 。 因 此 ， 如 果 使 用 行 波 进位 加 法 器 实现 图 6- 
3 中 的 加 法 /减法 部 件 ， 可 以 在 2 个 门 延迟 后 得 到 所 有 的 求 和 位 ， 包 括 7 输 入 端 经 历 的 异 或 门 延迟 。 
如 果 再 使 用 cs @cs- 1 来 检测 溢出 ， 则 检测 结果 可 以 在 2n + 2 个 门 延迟 后 得 到 。 

有 两 种 方法 可 以 减少 加 法 器 的 延迟 。 第 一 种 方法 是 使 用 最 快 的 电子 工艺 实现 行 波 进位 及 其 
变形 的 逻辑 设计 。 第 二 种 方法 是 使 用 比 图 6-2b 更 大 的 逻辑 门 网 络 结构 。 下 一 小 节 将 讲述 第 二 种 
方法 中 比较 容易 理解 的 一 个 版 本 。 实 际 上 有 许多 技术 已 经 被 用 来 实现 高 速 加 法 器 。 它 们 包括 快 
速 传播 进位 信号 的 电子 电路 设计 ， 以 及 下 一 小 节 中 的 基本 网 络 结构 的 各 种 变形 。 


超前 进位 加 法 


快速 加 法 器 电路 必须 加 速 进位 信号 的 产生 。 第 ; 步 s; (M) 与 c .， (进位 输出 ) 的 逻辑 表达 式 
为 (参见 图 6-1) 
$i = xi By PO 
和 
Cisi = Xi Yi + X; Ci + yiCi 
将 第 二 个 等 式 因 式 分 解 为 
Ciri = X; yi + (x; + yi) C; 
因此 我 们 可 以 写 出 
crl=C+Pci 
其 中 
Gi = x;y; VLK P, = x; + y, 
表达 式 G; 和 P; 分 别称 为 第 i 步 的 生成 函数 与 传播 (propagate) 函数 。 如 果 第 ;i 步 的 生成 函数 等 于 1， 
则 c + ,= 1， 而 与 进位 输入 c 无 关 。 这 种 情况 发 生 在 x 与 y 都 为 时。 传播 函数 意味 着 当 x 或 者 y; 其 
中 之 一 为 1 时 ， 进 位 输入 就 会 产生 进位 输出 。 所 有 的 G; 与 P; 都 可 以 在 X 与 7 向 量 加 载 到 4 位 加 法 器 
输入 端 一 个 逻辑 门 延迟 后 独立 并 行 地 生成 。 每 一 位 包括 一 个 与 门 以 生成 G;:， 一 个 或 门 以 生成 P;， 
以 及 一 个 三 输入 端 异 或 门 以 生成 ss。 仔细 观察 会 得 出 更 简单 的 电路 ， 我 们 发 现 使 用 P; = x, Oy: E 
以 实现 传播 函数 。 这 个 公式 只 在 5 = yi = 1 时 与 P;=x+y 不 同 。 但 这 时 Gj = 1， 所 以 P; 是 0 是 1 无 关 
紧要 。 这 样 ， 使 用 两 个 两 输入 端 异 或 门 的 级 联 来 实现 三 输入 端 异 或 功能 ， 图 6-4a 中 的 基本 单元 B 
可 以 用 于 每 一 位 段 的 计算 。 








Xy ys X, 六 xt yI Xo yo 


c4 





超前 进位 逻辑 


Go Po 


b) 4 位 加 法 器 
图 6-4 4 位 超前 进位 加 法 器 


使 用 以 - 1 为 下 标的 变量 扩展 c:， 并 将 其 代入 ci; 表达 式 ， 我 们 得 到 
ct=C+PCG-+PP_ic- 
继续 这 种 扩展 ， 任 一 进位 变量 的 最 终 表 达 式 为 
Ci, 1 = Gi + P,Gi- i + PiPi-1Gi-2 + ++ + P, P, - P, Go + PiPi Poco (6-1) 
这 样 ， 所 有 进位 都 可 以 在 加 载 输入 信号 X、7 及 co 三 个 门 延 迟 后 得 到 ， 因 为 生成 所 有 P; 与 Gi 信号 
只 需 一 个 门 延迟 ， 再 加 上 ci+ 1 与 ~ 或 电路 中 的 两 个 门 延迟 。 因 此 ，n 位 加 法 过 程 只 需 四 个 门 延迟 ， 
而 与 无 关 。 
我 们 现在 考虑 一 下 4 位 加 法 器 的 设计 。 其 进位 可 以 实现 为 
ci = Go + Poco 
cz = Gi + P,Go + P Poco 
c3 = G> + P2G1 + P;P Go + PPiPoco 
ca = Gs + PsG + P3P2G1 + PsP;P, Go + P+P,P Poco 
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图 6-4b 显 示 了 完整 的 4 位 加 法 器 。 进 位 在 标记 为 超前 进位 逻辑 的 部 件 中 实现 。 以 这 种 形式 实现 
的 加 法 器 称 为 超前 进位 加 法 器 。 该 加 法 器 对 所 有 的 进位 位 有 三 个 门 延迟 ， 对 所 有 的 求 和 位 有 四 
个 门 延迟 。 相 比较 而 言 ， 在 4 位 行 波 进位 加 法 器 中 ,需要 七 个 门 延迟 ， 而 cs 需要 八 个 门 延 迟 。 

如 果 想 要 扩展 图 6-4b 的 超前 进位 加 法 器 ， 使 它 能 够 对 更 长 的 操作 数 进 行 加 法 运算 ， 就 会 碰 
到 门 的 肩 入 《fan-in， 即 输入 端 数目 ) 限制 问题 。 由 表达 式 6-1， 我 们 看 到 最 后 的 与 门 和 或 门生 成 
Cit! 时 需要 的 扁 和 为 i+ 2。 在 4 位 加 法 器 中 ，c: 需要 的 扇 人 为 5。 这 已 经 接近 实际 门 的 极限 了 。 所 
以 图 6-4b 中 的 加 法 器 设计 不 能 直接 对 长 操作 数 进行 扩展 。 但 是 ， 如 果 我 们 将 几 个 4 位 加 法 器 级 联 
起 来 ， 如 图 6-2c 所 示 ， 就 可 以 构造 出 较 长 的 加 法 器 了 。 

8 个 4 位 超前 进位 加 法 器 可 以 如 图 6-2c 那 样 连接 起 来 构成 一 个 32 位 加 法 器 。 级 联 中 高 端的 4 位 
加 法 器 生成 求 和 位 531、s30o、szs、szs 以 及 cs 所 需 的 延迟 计算 如 下 : 低 端 加 法 器 的 进位 输出 cs 在 输 
入 操作 数 X、7 及 co 加 载 到 32 位 加 法 器 三 个 门 延迟 后 获得 。 之 后 ， 第 二 个 加 法 器 的 输出 cs 再 经 过 
两 个 门 延迟 获得 ，ctz 需要 再 经 过 两 个 门 延迟 ， 依 次 类 推 。 最后， 高 端 4 位 加 法 器 的 进位 输入 cz 
可 以 在 (6x 2)+3=15 个 门 延迟 后 获得 。 这 样 , cy 和 高 端 加 法 器 内 的 所 有 进位 还 需要 两 个 门 延迟 ， 
而 4 个 求 和 位 需要 再 经 历 一 个 门 延迟 获得 ， 一 共 是 18 个 门 延迟 。 作 为 对 比 ， 如 果 使 用 行 波 进 位 加 
ER., sa 与 cz 的 总 延迟 数 为 63 和 64。 

下 一 小 节 将 对 刚才 讨论 的 级 联结 构 加 以 改进 ， 从 而 进一步 减少 延迟 。 关 键 的 思想 是 并 行 地 
生成 进位 te、cs 等 就 像 在 4 位 超前 进位 加 法 器 中 并 行 地 生成 c:、c2、c3、cs 一 样 。 

高 层 的 生成 与 传播 函数 

在 刚才 讨论 的 32 位 加 法 器 中 ， 进 位 cg、cs、cn 等 波动 地 通过 各 个 4 位 加 法 器 部 件 ， 每 个 部 件 
两 个 门 延 迟 ， 这 与 行 波 进位 加 法 器 中 单个 进位 波动 通过 每 个 位 段 的 方式 非常 相像 。 通 过 使 用 高 
层 的 生成 与 传播 函数 ， 就 有 可 能 在 高 层 的 超前 进位 电路 中 使 用 超前 进位 方法 并 行 地 生成 进位 c4、 
Cas Ci $, 

图 6-5 显 示 了 由 四 个 4 位 加 法 器 部 件 构成 的 16 位 加 法 器 。 这 些 部 件 提供 了 新 的 输出 函数 G! 
与 及 ， 其 中 上 = 0 对 应 于 第 一 个 4 位 部 件 ( 如 图 6-4b), k= 1 对 应 于 第 二 个 4 位 部 件 ， 依 次 类 推 。 在 
第 一 个 部 件 中 ， 

F, = P,P,P.P, 
G! =G,+P,G,+P,P,G, + PPPG, 





图 6-5 由 4 位 加 法 器 构造 的 16 位 超前 进位 加 法 器 ( 见 图 6-4b) 
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简单 地 说 ， 第 一 层 G; 与 P 函数 决定 了 位 段 泥 否 生成 或 传播 进位 ， 而 第 二 层 G4 与 函数 决定 了 部 
件 砷 否 生成 或 传播 进位 。 有 了 这 些 新 函数 ， 就 没有 必要 等 待 进位 波动 通过 4 位 部 件 了 。 进 位 cr 
由 图 6-5 所 示 的 超前 进位 电路 按 以 下 公式 生成 
Ca =G; +PG +PPG +P, P, P'G, +P P P' Pre, 

4 位 部 件 的 进位 输入 也 由 相似 的 简单 表达 式 并 行 地 生成 。cis。、ciz、cs 及 c4 的 表达 式 形 式 分 别 与 
6-4b 超 前 进位 电路 所 实现 的 c、c3、c2 及 c1 相同 。 只 是 变量 名 改变 了 。 因 此 ， 图 6-5 中 超前 进位 电 
路 的 结构 与 图 6-4b 是 完全 相同 的 。 但 是 我 们 应 当 注意 ， 由 4 位 加 法 器 部 件 内 部 产生 的 进位 cg、cs、 
ca、cua 在 图 6-5 中 并 不 需要 ， 因 为 在 这 里 它们 是 由 高 层 的 超前 进位 电路 生成 的 。 

现在 ， 我 们 考虑 16 位 超前 进位 加 法 器 产生 输出 所 需 的 延迟 。 超 前 进位 电路 产生 进位 所 需 的 
延迟 比 生成 G MP, SAA DER. MER G, AP 在 生成 G 和 P; 之 后 分 别 需要 两 个 和 一 个 门 延 
迟 。 因 此 ， 超 前 进位 电路 在 X、 了 及 co 加 载 到 输入 端 五 个 门 延迟 后 即 可 得 到 所 有 的 进位 。 进 位 cr 
是 在 图 6-5 的 高 端 4 位 部 件 内 部 产生 的 ， 它 比 cz 晚 两 个 门 延迟 ， 之 后 s5 又 晚 了 一 个 门 延迟 。 因 此 ， 
sis 将 在 八 个 门 延迟 后 得 到 。 注 意 ， 如 果 采 用 级 联 4 位 超前 进位 加 法 器 的 方法 构造 16 位 加 法 器 ， 生 
成 cs 和 ss 的 延迟 分 别 为 九 和 十 个 门 延迟 ， 而 图 6-5 只 需 五 和 八 个 门 延迟 。 

两 个 16 位 加 法 器 部 件 可 以 级 联 构成 一 个 32 位 加 法 器 。 这 时 ， 低 端 部 件 的 输出 cis 成 为 高 端 部 
件 的 进位 输入 。 其 延迟 要 比 以 前 讨论 过 的 32 位 加 法 器 少 得 多 ， 那 时 我 们 通过 级 联 八 个 4 位 加 法 器 
来 构造 32 位 加 法 器 。 在 该 加 法 器 中 ，ss 在 18 个 门 延迟 后 得 到 ，c3z 在 17 个 门 延 迟 后 得 到 。 级 联 两 
个 16 位 加 法 器 的 延迟 分 析 如 下 : 我 们 刚刚 讨论 过 ， 低 端 部 件 的 进位 输出 cis 在 五 个 门 延迟 后 得 到 。 
高 端 部 件 的 czs 和 ca 在 随后 的 两 个 门 延迟 得 到 ，c3 在 cx 之 后 的 两 个 门 延 迟 得 到 。 因 此 ca 在 总 共 
九 个 门 延 迟 后 得 到 ， 而 ss 则 需要 十 个 门 延迟 。 另 外 ，ss 和 ca 分 别 在 十 和 七 个 门 延迟 后 获得 ， 作 
为 比较 ， 如 果 使 用 八 个 4 位 加 法 器 级 联 构成 的 32 位 加 法 器 ， 获 得 相同 的 结果 则 分 别 需 要 18 和 17 个 
门 延 迟 。 

从 第 一 层 C; 和 P; 函数 生成 第 二 层 GAP, 函数 所 用 的 推理 可 以 用 来 从 G AP 函数 生成 第 三 
EGAR" 函数。 这 两 个 第 三 层 函 数 在 图 6-5 中 被 表示 为 超前 进位 逻辑 的 输出 。 使 用 四 个 图 6-5 中 
的 16 位 加 法 器 、， 再 加 上 产生 进位 ci。、csz、css、ces 的 超前 进位 逻辑 电路 ， 就 可 以 构成 一 个 64 位 加 
法 器 。 使 用 上 面 对 16 位 加 法 器 推理 的 扩展 ， 可 以 证 明 这 个 加 法 器 的 延迟 为 se 需要 12 个 门 延迟 ， 
ce 需要 七 个 门 延迟 。( 参 见习 题 6.10。) 


63 正 数 乘法 


图 6-6a 显 示 了 二 进 制 系统 中 手工 进行 整数 乘法 的 普通 算法 。 该 算法 适用 于 无 符号 数 和 有 符 
号 正 数 。 两 个 "位 数 的 积 少 于 2m 位 ， 因 此 如 图 所 示 ， 本 例 中 两 个 4 位 数 的 积 为 8 位 。 在 二 进 制 系统 
中 ， 被 乘 数 与 乘 数 的 一 位 相 乘 是 很 容易 的 。 如 果 乘 数位 为 1， 则 在 适当 的 位 置 放 和 人 被 乘 数 ， 并 添 
加 到 部 分 积 。 如 果 乘 数位 为 0， 则 放 入 0， 如 示例 的 第 三 行 。 

正 数 的 二 进 制 乘法 可 以 用 二 维 组 合 逻辑 阵列 实现 ， 如 图 6-6b 所 示 。 每 个 单元 的 主要 组 成 部 
分 是 一 个 全 加 器 FA。 每 个 单元 的 与 门 根据 乘 数位 q; 的 值 决定 被 乘 数位 mj 是否 要 加 到 传人 的 部 分 
乘积 位 。 如 果 g: = 1， 每 一 行 ; (其 中 0<i<3) 将 (经 过 适当 移 位 的 ) 被 乘 数 加 到 传人 的 部 分 乘 
积 PR 上 ， 以 生成 传 出 的 部 分 乘积 PP (i + 1)。 如 果 g; = 0， 则 PPi 就 不 经 改变 地 向 下 传 出 。PP0 为 全 
0， 而 PP4 为 乘积 结果 。 被 乘 数 沿 着 倾斜 的 信号 传输 路 径 每 行 左 移 一 个 位 置 。 
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1 1 ! (13) 被 乘 数 M 
TD (1) RRQ 
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a) 于 工 相 乘 算法 
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传 出 的 部 分 乘积 位 [PP G+1)) 
b) 阵列 实现 
图 6-6 二 进 制 正 数 的 阵列 乘法 


最 坏 情 况 下 的 信号 传输 延迟 路 径 是 从 阵列 的 右上 角 到 阵列 左下 角 的 高 端 乘积 位 。 这 条 路 径 
包括 每 行 右 端的 两 个 单元 和 最 底 行 的 所 有 单元 ， 呈 现 出 阶梯 状 模式 。 假 设 从 全 加 器 部 件 的 输入 
到 输出 需要 两 个 门 延 迟 ， 则 对 mx 阵列 而 言 ， 该 路 径 的 总 延迟 为 6(n - 1) - 1 个 门 延迟 ， 包 括 所 有 
单元 中 初始 的 与 门 。( 参 见习 题 6.12。) 阵列 的 第 一 行 实际 上 只 需要 与 门 ， 因 为 传人 的 部 分 积 PP0 
为 0。 在 推导 延迟 表达 式 时 已 经 考虑 了 这 一 点 。 

通常 在 处 理 器 的 指令 集中 提供 了 乘法 操作 。 高 性 能 处 理 器 芯片 使 用 其 上 的 一 部 分 重要 区 域 
执行 整数 与 浮 点 数 的 算术 运算 。( 本 章 的 后 面 会 讨论 浮 点 操作 。) 尽管 前 面 的 组 合 乘法 器 易于 理 
解 ， 但 在 计算 实际 大 小 的 数字 (如 32 位 或 64 位 数字 ) 时 ， 它 使 用 了 太 多 的 门 。 乘 法 操作 还 可 以 
通过 使 用 图 6-6 中 组 合 阵列 技术 与 需要 较 少 组 合 逻辑 的 时 序 技术 的 混合 来 实现 。 

进行 乘法 计算 最 简单 的 方法 是 使 用 ALU 中 的 加 法 电路 按 硕 序 进行 一 系列 操作 。 图 6-7a 的 框 
图 显示 了 顺序 乘法 电路 的 硬件 组 成 。 该 电路 通过 使 用 一 个 n 位 加 法 器 通过 n 次 运算 来 实现 图 6-6b 





kx am 


中 4 行 行 波 进位 加 法 器 执行 的 空间 加 法 。 寄 存 器 A 和 Q 共 同 容纳 PPi， 而 乘 数位 q; 产生 “加 /不 加 ” 
信号 。 该 信号 控制 被 乘 数 M 与 PPi 的 加 法 操作 ， 从 而 生成 PP (i + 1)。 乘 积 需 要 n 个 周期 计算 。 从 禄 
始 向 量 PPO (寄存 器 A 中 的 x 个 0) 开始 ， 在 每 一 周期 中 部 分 积 PPi 的 长 度 都 增长 一 位 。 加 法 器 的 进 
位 存储 于 触发 器 C 中 ， 它 在 寄存 器 A 的 左 侧 。 开 始 时 ， 乘 数 装载 到 寄存 器 Q 中 ， 被 乘 数 装载 到 寄 
存 器 M 中 ， 而 C 和 A 被 清 零 。 在 每 一 周期 的 结束 ，C、A 和 Q 右 移 一 位 以 容纳 部 分 积 的 增长 ， 同 时 
乘 数 移出 寄存 器 Q。 由 于 这 种 移 位 ， 寄 存 器 Q LSB 位 置 上 的 乘 数位 9, 可 以 在 正确 的 时 刻 生成 “加 / 
不 加 ”信号 ， 由 第 一 个 周期 的 ge 到 第 二 个 周期 的 91 等 。 这 些 乘 数 位 使 用 过 后 就 被 右 移 操作 丢弃 
了 。 注 意 ， 加 法 器 的 输出 是 PP G + 1) 的 最 左 位 ， 它 必须 保存 在 触发 器 C 中 ， 并 随 A 和 Q 的 内 容 一 
起 右 移 。“" 个 周期 之 后 ， 乘 积 的 高 位 部 分 保存 在 寄存 器 A 中 ， 而 低位 部 分 保存 在 寄存 器 Q 中 。 图 
6-7b 显 示 了 以 这 种 硬件 安排 执行 的 图 6-6a 的 乘法 示例 。 


-寄存 器 A (初始 为 0) 





加 /不 加 控制 







控制 序列 发 生 器 


被 乘 数 M 





a) 寄存 器 配置 
oro = 初始 设置 
[LT 
Q —. 
0 1101 1011 I 
0 0110 e A L 第 一 个 周期 
1 0011 | 1 01 I I 
0 100 1 Lo 7 ) 第 一 个 周期 
0 1001 | 110 I 
0 0100 1111 不 加 移 位 第 一 个 周期 
1 0001  —. 
0 1000 1111 加 移 位 } 第 四 个 周期 
— — — 
乘积 


b) 乘法 示例 
图 6-7 二 进 制 乘法 顺序 电路 
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使 用 这 种 顺序 硬件 结构 时 可 以 明显 地 看 出 ， 执 行 乘法 指令 所 需 的 时 间 要 比 执行 加 法 指令 长 
得 多 。 有 上 几 种 技术 可 以 加 速 乘法 运算 ， 我 们 将 在 下 面 的 小 他 中 进行 讨论 。 


6.4 有 符号 操作 数 乘法 


我 们 现在 讨论 有 符号 操作 数 的 补 码 乘法 ， 它 生成 长 度 加 售 的 积 。 总 的 策略 依然 是 加 入 由 乘 
数位 确定 的 被 乘 数 ， 从 而 累加 部 分 积 。 


1 0 0 1 1 -13 
首先 ， 考 虑 正 乘 数 和 负 被 乘 数 的 情况 。 当 我 们 将 0 1 0 1 1 GID 
负 的 被 乘 数 加 到 部 分 积 时 ， 必 须 将 被 磁 数 符号 位 的 值 “，，， 0 了， 
扩展 到 乘积 的 最 左边 。 例 如 在 图 6.8 中 ，5 位 有 符号 操作 。，， ，，。。，， 


数 - 13 为 被 乘 数 ， 乘 以 乘 数 +11， 得 到 了 10 位 的 乘积 
- 143。 被 乘 数 的 符号 扩展 如 图 所 示 。 这 样 ， 如 果 前 面 
讨论 过 的 硬件 提供 部 分 积 的 符号 扩展 ， 它 就 可 以 接受 


: 0 0 0 0 0 
1 ; 1 0 0 1 I 


‘>` 0 0 0 0 O 


负 被 乘 数 。 — `  ” `” _ _ 
对 于 负 乘 数 ， 直 接 的 解决 办 法 就 是 形成 乘 数 与 被 I 10 1 1 1 0 0 0 1 (Cl3) 
乘 数 的 补 码 ， 并 按照 正 乘 数 的 情况 进行 运算 。 可 以 这 图 6-8 负 被 乘 数 的 符号 扩展 


样 做 是 因为 对 两 个 操作 数 求 补 并 不 改变 乘积 的 值 或 符号 。 下 面 我 们 将 讨论 一 种 对 正 负 乘 数 乘法 
效果 同样 好 的 技术 ， 称 为 Booth 算 法 。 


Booth 算 法 


Booth 算 法 生成 24 位 的 乘积 而且 它 以 统一 的 方式 对 待 正 负 补 码 形式 的 a 位 操作 数 。 要 理解 
该 算法 的 实质 ， 考 虑 一 个 乘法 ， 其 中 乘 数 为 正 数 而 且 有 惟一 的 一 块 区 域 为 全 1， 例 如 0011110。 
为 了 得 到 乘积 ， 在 标准 程序 中 需要 将 四 个 适当 移 位 的 被 乘 数 相 加 。 但 是 ， 通 过 将 乘 数 看 作 是 两 
个 数 的 差 可 以 减少 所 需 操作 的 数目 : 

0100000 (32) 
-0000010 (2) 
0011110 (30) 


这 意味 着 将 被 乘 数 的 2 倍 与 2! 倍 的 补 码 相 加 即 可 得 到 乘积 。 为 了 方便 ， 我 们 可 以 将 前 面 的 乘 数 
重新 编码 为 0 + 1000 - 10， 并 以 此 描述 所 需 操作 的 顺序 。 

一 般 而 言 ， 在 Booth 算 法 中 ， 从 右 至 左 扫描 乘 数 ， 由 0 变 为 1 时 将 移 位 的 被 乘 数 乘 以 -1， 由 1 
变 为 0 时 将 移 位 的 被 乘 数 乘 以 +1。 图 6-9 演 示 了 刚才 例子 的 普通 算法 与 Booth 算 法 。 很 明显 ， 
Booth 算 法 可 以 扩展 到 包含 任意 块 数 1 的 乘 数 ， 包 括 将 单独 的 1 视 为 一 块 的 情况 。 图 6-10 是 对 乘 数 
进行 重 编码 的 另 一 个 例子 。 当 乘 数 的 最 低 有 效 位 为 1 时 ， 假 设 其 右 方 隐 含 包括 一 个 0。Booth 算 法 
还 可 以 直接 应 用 于 负 乘 数 的 情况 ， 如 图 6-11 所 示 。 

为 了 证 明 Booth 算 法 对 负 乘 数 的 正确 性 ， 我 们 使 用 补 码 系统 中 负数 表示 的 以 下 性 质 : 假设 负 
数 X 中 最 堪 方 的 0 在 位 置 人 不 ， 即 

X=1l1:-: 10x;_ 1: Xo 
则 X 的 值 为 
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V(K =- 2+] + xp- x 2l e + Xo x 29 


0 1 0 11 0 1 ` 
0 0+1+1+1+1 0 
00000 0 0 
0 1 O 1 10 1 
0 1 0 1 1 Q i 
0 10 1 1 0 1 
0 1 O 1 101 
0 0 0 0 0 0 0 
0 0 0 0 0 0 
0 0 1 010 101 00 0 1 1 0 
0 10 1 1 O 1 
0+1 0 0 0-1 0 
0 6 ú 8 6 6 Š 0 00 0 0 00. 0 
I 1 i ií 1 0 10 0 1 1 < 被 乘 数 的 补 码 
o 8 6 ü 5 0 0 0 0 0 0 O 
5 ü 060 6 0 0 0 0 00 0 
8 g ü 0 0 0 0 0 0 0 
ñ g 0 1 0 1 10 1 
6 0 0 0 0 0 0 0 
0 00 1 01 0 1000 1 1 O 


图 6-9 普通 乘法 与 Booth 乘 法 方案 
0 0 1 0 1 1 0 0 1 1 1 0 1 0 1 1 0 0 
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0 +1 -1 +1 0-1 0+1 0 0 -1+l-1+1 0-1 0 0 


图 6-10 乘 数 的 Booth 重 编码 


01101 (+13) F. 01 1011 

xl 1 0 1 0 (-6 t 0 -1+1 -1 0 
£ ü 6 ü ó 00000 
i i 1 10011 
S8801101 
i 10011 
o 00000 
1 1101100 ! 0 (-78) 


图 6-11 负 乘 数 的 Booth 乘 法 
VCO 表 达 式 的 正确 性 可 以 这 样 证 明 ， 即 将 X 看 作 是 以 下 两 个 数 之 和 |: 
11…100000…0 
+ 00---00x -1x0 
X= 11- 10x: -1 Xo 
其 中 上 面 的 数 是 - 22 1! 的 补 码 表 示 。 现 在 ， 重 编码 的 乘 数 的 一 部 分 就 是 和 式 中 的 第 二 个 数 ,， 并 且 ”382 
其 k+ 1 位 为 -1。 例 如 ， 乘 数 110110 可 以 重 编码 为 0- 1 + 10 — 10, 
图 6-12 总 结 了 对 乘 数 重 编码 的 Booth 技 术 。 由 011…110 至 +100…0 - 10 的 转换 称 作 跳 过 1 位 。 





人 


这 个 术语 是 从 乘 数 中 包含 连续 全 1 的 块 区 域 的 情况 得 来 的 。 只 需 几 个 移 位 被 乘 数 〈 求 和 项 ) 的 版 
情况 下 ， 即 乘 数 中 的 1 和 0 交替 时 ， 乘 数 的 每 一 位 都 将 选择 天 必 AREMA 
一 个 求 和 项 。 实 际 上 ， 它 产生 的 求 和 项 比 不 使 用 Booth 算 Fit mizi 
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法 时 还 要 多 。 图 6-13 显 示 了 16 位 的 最 坏 情 况 、 普 通 情况 和 。 0 o ， 0xM 
较 好 情况 下 的 乘 数 。 0 1 | +1xM 
Booth 算 法 有 两 个 吸引 入 的 特征 , 第 一 , 它 以 统一 的 1 0 -IxM 

ií r ， 


方式 处 理 正 负 乘 数 ;第 二 ， 当 乘 数 中 包含 很 多 大 的 全 l 块 5 0 l L DM 
区 域 时 ， 它 的 效率 很 高 。 通 过 跳 过 1 位 而 提升 的 速度 依赖 图 6-12 Booth 乘 数 重 编码 表 
于 数据 。 平 均 情况 下 ， 使 用 Booth 算 法 进行 乘法 运算 的 速度 与 使 用 普通 算法 相同 。 


010 10 101 1 0101 1 01 01 


最 坏 情 况 下 E 
的 乘 数 
+} =} +l ~l +I -1 +l -] +l -1 +! -1 +l -1 +l -l 
l 1 000 10 1 101 11 10 0 
普通 情况 下 | 
的 乘 数 ` 
0 -1 0 0+-1+ 0-I+ 000-100 
000 0 ! 11 i: 0000 11 1 
较 好 情况 下 | 
的 乘 数 ` 


0 0 0+ 0010 0 0-1 00 0+ 0 0 


图 6-13 Booth R 48800 38: 
6.5 快速 乘法 


现在 我 们 讲述 两 种 提高 乘法 运算 速度 的 技术 。 第 一 种 技术 保证 对 于 zx 位 操作 数 ， 参 与 加 法 的 
求 和 项 〈 被 乘 数 的 不 同 版 本 ) 的 最 大 数目 为 %/2。 第 二 种 技术 减少 了 计算 求 和 项 加 法 的 时 间 。 


6.5.1 RAAR 


位 偶 重 编码 (bit-pair recoding) 技术 可 将 求 和 项 的 最 大 数目 减少 一 半 。 它 直接 派生 于 Booth 
算法 。 将 Booth 算 法 重 编码 的 乘 数 位 组 成 对 时 ， 可 以 观察 到 : 对 (+1 - 1) 与 对 (0 +1) 是 等 价 的 。 
也 就 是 说 ,不 是 将 移 位 位 置 i 上 - 1 倍 的 被 乘 数 M 与 位 置 ; + 1 上 +1 倍 的 M 相 加 ， 而 是 在 位 置 :加 入 
+1x M， 也 可 以 得 到 相同 的 结果 。 其 他 的 例子 有 : (+1 0) 与 (0 +2) 等 价 ，(-1 +1) 与 (0 -1D 等 
价 ， 等 等 。 这 样 ， 如 果 从 右边 开始 对 Booth 算 法 重 编码 的 乘 数 每 次 检查 两 位 ， 那 么 对 于 每 一 对 乘 
数位 最 多 只 需要 加 入 一 个 被 乘 数 。 图 6-14a 显 示 了 对 图 6-11 中 乘 数 的 位 偶 重 编码 ， 而 图 6-14b 显 示 
了 在 所 有 可 能 的 情况 下 被 乘 数 的 选择 决策 表 。 图 6-15 使 用 乘 数 的 位 偶 重 编码 重新 计算 了 图 6-11 中 
的 乘法 。 
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a) 由 Booth 重 编码 派生 的 位 偶 重 编码 


右 侧 乘 数位 


i-l | 





= e e ee 


b) 被 乘 数 选择 决策 表 
图 6-14 乘 数位 偶 对 重 编码 


6.5.2 求 和 项 的 进位 保留 加 法 


在 乘法 中 需要 将 几 个 求 和 项 相 加 。 一 种 称 为 进位 保留 加 法 
(carry-save addition, CSA) 的 技术 可 以 提高 加 法 速度 。 考 虑 图 
6-16a 中 的 4 x 4 乘法 阵列 。 这 个 结构 是 图 6-6 中 的 普通 阵列 ， 它 的 
第 一 行 只 包含 实现 位 乘积 mqgo、m2go、miqo 和 moqo 的 与 门 。 

我 们 可 以 不 让 进位 在 各 行 中 波动 ， 而 是 将 它们 “保存 ”起 
来 ， 并 在 正确 的 权重 位 置 上 将 它们 引入 到 下 一 行 中 ， 如 图 6-16b 
所 示 。 这 释放 了 第 一 行 中 三 个 全 加 器 的 一 个 输入 端 。 这 些 输入 
端 用 来 引入 第 三 个 求 和 项 的 位 乘积 m2g:、m1iq:、mog。 现 在 ， 第 
二 行 中 每 个 全 加 器 的 两 个 输入 端 装载 了 来 自 第 一 行 的 和 与 进位 
输出 。 第 三 个 输入 端 用 来 引入 第 四 个 求 和 项 的 位 乘积 m2g;、 miqa. 
mos, $ =n Uq 4-3 Hi BJ Bs Ba ira ga maq; 与 mq 被 引入 到 
第 二 与 第 三 行 堪 侧 其 余 空闲 的 输入 端 中 。 来 自 第 二 行 的 保留 进 
位 位 及 求 和 位 现在 加 载 到 第 三 行 ， 从 而 得 到 最 终 的 乘积 位 。 

进位 保留 阵列 的 延迟 比 行 波 进位 阵列 要 小 一 些 。 这 是 因为 
每 一 行 的 输出 向 量 9 和 C 是 在 一 个 全 加 器 延迟 中 并 行 生成 的 。 延 
迟 的 减少 量 将 在 习题 6.22 中 考虑 。 
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图 6-15 乘法 中 只 需 n/2 个 求 和 项 





274 #6 





0 m3q0 m2qo migo moqo 





a) 行 波 进位 阵列 【图 6-6 的 结构 ) 


0 m3q0 m240 migo mogo 








b) 进位 保留 阵列 
图 6-16 4 位 操 件数 乘法 操作 M x Q = P 的 行 波 进位 与 进位 保留 阵列 


使 用 下 面 的 方法 可 以 更 显著 地 减 小 延迟 。 在 长 操作 数 乘法 中 需要 对 许多 求 和 项 求 和 ， 我 们 
可 以 将 三 个 求 和 项 分 为 一 组 ， 并 对 每 个 组 并 行 地 执行 进位 保留 加 法 ， 从 而 在 一 个 全 加 器 延迟 中 
得 到 一 系列 5 与 C 向 量 。 然 后 将 所 有 的 S 和 C 向 量 分 为 三 个 一 组 ， 对 它们 执行 进位 保留 加 法 ， 从 而 
在 一 个 全 加 器 延迟 中 生成 更 深 一 层 的 5 与 C 向 量 。 我 们 将 这 个 过 程 继续 ， 直 到 只 剩 下 两 个 向 量 。 
然后 它们 就 可 以 使 用 行 波 进位 加 法 器 或 超前 进位 加 法 器 相 加 ， 求 得 最 终 的 乘积 。 

考虑 两 个 6 位 无 符号 数 相 乘 且 乘 数 的 全 部 位 均 为 1 时， 对 六 个 被 乘 数 的 移 位 版 本 求 和 的 情况 。 
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图 6-17 显 示 了 这 个 例子 。 图 6-18 使 用 进位 保留 加 法 对 六 个 求 和 项 4，B，…，F 求 和 。 两 幅 图 中 的 
“ 黑 框 ”指示 了 相同 的 操作 数位 ， 还 显示 了 它们 是 怎样 在 图 6-18 的 进位 保留 加 法 中 变 为 一 系列 求 
和 位 与 进位 位 的 。 示 例 中 执行 了 三 个 层次 的 进位 保留 加 法 ， 它 们 在 图 6-19 中 表示 了 出 来 。 从 图 中 
可 以 明显 看 出 ， 最 终 的 两 个 向 量 54 与 C4 在 六 个 输入 求 和 项 加 载 到 第 一 层 三 个 全 加 器 延迟 后 得 到 。 
生成 最 终 乘积 的 $4 与 C4 之 间 的 普通 加 法 操作 可 以 使 用 行 波 进位 加 法 器 或 超前 进位 加 法 器 完成 。 





1 0 1 1 0 1 (45) M 
x 1 1 1 1 1 1! (63) Q 
Kum I 1 0 1 A 
1 ioi1 1 0 1 B 
1 011 1 0 1 C 
1 0 1 0 1 D 
l 0 1 11011 E 
1 0 1 1 O l F 
1 O 1 1 0 0 0 1 0 0 1 1 (2,835) pal 


图 6-17 用 来 展示 图 6-18 中 进位 保留 加 法 的 乘法 示例 

















1 0 1 1 0 1 M 
Xi 1 1 ! 1 1 Q 
llo 1 1 O 1 A 
1 011 1 0 1 B 
l 0 111 0 1 c 
l 1 [9] 0 0 0 1 1 ; S, 
o o[i]i í í o o0 a 
1 0 1 0 1 | D 
1 0 1 a E 
1 0 1 1 O F 
11000[ol11 S, ~ 
oo í ıafijo o | Cr =- 
| 一 
1 1 0 0 00 411 LS， 
00 1 1 1 10 O — C, 
1 10 0 0 0 1 1 H Sy 
1 10 10 10 0. 0 1 1 1 1 S3 
00 0 0 10 100100 G, 
00 1 1 1 1 0 0 C2 ~ 
01 0 11 10 100 0 l 1 1 S4 
+0 1 0 10 10 0 0 0 0 C, 
1011000 01 1001 1 1 乘积 


图 6-18 使 用 进位 保留 加 法 计算 图 6-17 中 的 乘法 示例 
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让 我 们 计算 一 下 图 6-18 和 图 6-19 中 进行 6 x 6 乘法 总 的 逻辑 门 延迟 。 在 经 过 根据 乘 数 位 选择 求 
和 项 的 一 个 与 门 延迟 后 ， 所 有 的 六 个 求 和 项 都 加 载 到 第 一 层 eD CRA 
CSA。 假 设 每 一 层 CSA 有 两 个 门 延迟 ， 则 第 三 层 CSA 的 输出 ll I LL 第 一 层 CSA 
S, 和 C4 在 六 个 门 延迟 后 得 到 。 最 终 两 个 向 量 的 加 法 可 以 使 用 cC, s G Si 
图 6-5 的 超前 进位 加 法 器 在 八 个 门 延迟 后 完成 。 因 此 总 的 门 | 第 一 层 CSA 
延迟 为 15。 作 为 比较 ,使 用 图 6-6 中 的 n x n 阵列 进行 乘法 运 。 中 C3 S 
算 的 总 的 门 延迟 为 6 (n 一 1) 1; 所 以 6 x 6 阵列 的 总 门 延迟 为 ”一 一 一 一 第 三 层 CSA 


29。 延 迟 的 减 半 是 对 求 和 项 并 行使 用 进位 保留 加 法 和 对 两 个 M. ttg his 
最 终 向 量 使 用 超前 进位 加 法 的 共同 结果 。 T 
当 求 和 项 的 数目 很 大 时 , 节省 的 时 间 也 相应 地 大 幅 增 加 。 乘积 
例如 ， 按 照 图 6-19 的 模式 使 用 进位 保留 加 法 对 32 个 数 求 和 ， 图 6-19 图 6-18 中 进位 保留 
在 最 终 的 加 法 前 只 需要 八 层 CSA 操 作 。 一 般 而 言 ， 可 以 证 明 加 法 操作 的 图 示 


将 k 个 求 和 项 降 为 最 终 求 和 的 两 个 向 量 大 约 需 要 1.7log2k - 1.7 层 的 CSA 操 作 (见习 题 6.23)。 可 以 
使 用 64 位 超前 进位 加 法 器 计算 两 个 最 终 向 量 的 加 法 。32 x 32 乘 法 的 总 延迟 计算 如 下 : 初始 的 与 
门 需要 一 个 门 延 迟 ， 其 输出 为 32 个 求 和 项 ; 八 层 CSA 操 作 需 要 16 个 门 延迟 ; 64 位 加 法 器 的 最 长 
路 径 (到 sw) 需要 12 个 门 延迟 。 因 此 总 延迟 为 29 全 门 延 迟 。 作 为 比较 ， 使 用 阵列 乘法 器 计算 
32 x 32 乘 法 需要 185 个 门 延 迟 才 能 得 到 最 后 的 乘积 位 。 

我 们 在 讨论 使 用 进位 保留 加 法 加 速 乘法 操作 时 忽略 了 一 些 问 题 。 首 先 ， 当 求 和 项 为 负 时 ， 
就 像 在 使 用 Booth 算 法 计算 有 符号 数 乘法 时 一 样 ， 必 须 在 CSA 逻 辑 中 加 入 符号 扩展 。 在 这 里 并 不 
需要 将 符号 扩展 到 整个 两 倍 的 乘积 长 度 ， 只 需 在 每 一 层 CSA 作 几 位 的 扩展 。 其 次 ， 我 们 以 前 假 
定 对 n x n 乘 法 对 两 个 最 终 向 量 S 和 C 求 和 需要 使 用 2n 位 的 超前 进位 加 法 器 。 然而 实际 上 参加 最 终 
加 法 的 位 数 要 少 ， 因 为 一 些 低位 的 乘积 位 已 经 在 早 些 时 候 确 定 了 。 但 这 并 不 影响 大 局 ; 而 且 我 
们 曾经 使 用 的 延迟 分 析 也 是 正确 的 ， 因 为 加 法 器 的 位 数 并 没有 显著 缩短 ;最 后 ， 我 们 对 n ng 
法 使 用 了 “个 求 和 项 。 但 如 果 使 用 了 乘 数 的 位 偶 重 编码 技术 ， 求 和 项 的 数目 就 会 降 为 mw2。 这 也 
将 CSA 的 层 数 从 1.7logzn - 1.7 减 少 为 1.7logz 一 3.4。 

快速 乘法 总 结 

现在 我 们 总 结 一 下 快速 乘法 技术 。 由 Booth 算 法 发 展 而 来 的 乘 数位 偶 重 编码 技术 可 将 求 和 项 
的 数目 减少 为 原来 的 112。 使 用 较 少数 目的 进位 保留 加 法 可 以 进一步 将 求 和 项 的 数目 降 为 2。 最 
终 的 乘积 可 以 通过 使 用 超前 进位 加 法 器 进行 一 次 加 法 得 到 。 高 性 能 处 理 器 的 设计 师 已 经 使 用 了 
所 有 这 三 种 技术 一 一 乘 数 的 位 偶 重 编码 、 求 和 项 的 进位 保 留 加 法 和 超前 进位 加 法 一 一 来 减少 执行 
乘法 操作 所 需 的 时 间 。 


6.6 整数 除法 


在 6.4 节 讨论 整数 乘法 时 ， 我 们 将 手工 和 逻辑 电路 计算 乘法 操作 的 方法 联系 了 起 来 。 在 这 里 
将 使 用 同样 的 方法 讨论 整数 除法 。 我 们 将 详细 地 讨论 正 数 除法， 然后 再 对 有 符号 操作 数 的 情况 
作 一 般 性 的 说 明 。 

图 6-20 显 示 了 相同 数值 十 进 制 与 二 进 制 除法 的 示例 。 先 来 看 一 下 十 进 制 的 情况 。 商 中 的 2 是 
由 以 下 推理 确定 的 ; 首先 ， 试 着 用 13 去 除 2， 但 这 不 行 。 然 后 ， 试 着 用 13 去 除 27。 我 们 试探 着 将 





13 乘 以 2 得 到 26， 而 且 27 - 26 = 1 小 于 13， 所 以 上 商 2 并 进行 所 需 的 减法 。 被 除数 的 下 一 位 4 被 放 
下 来 ， 最 后 我 们 用 13 去 除 14， 余 数 为 1。 还 可 以 用 相同 的 方 
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式 讨论 二 进 制 除法 ， 而 且 由 于 商 中 的 各 位 只 能 为 0 或 1， 所 以 1374 1101 J100010010 
二 进 制 的 除法 运算 更 简单 。 Ta — 10000 
用 这 种 笔算 方法 实现 除法 的 电路 操作 如 下 它 先 将 除数 3 1101 
与 被 除数 适当 地 对 齐 并 执行 减法 。 如 果 余数 为 0 或 为 正 ， 则 | 01 
可 确定 商 位 为 1 ， 而 余数 用 被 除数 的 下 一 位 扩展 ， 除 数 重新 i 
定位 ， 再 执行 下 一 次 减法 。 反 之 ， 如 果 余 数 为 负 ， 则 可 确定 图 6-20 笔算 除法 示例 


商 位 为 0， 被 除数 加 上 除数 以 恢复 原 值 ， 然 后 除数 重新 定位 ， 执 行 下 一 次 减法 。 

恢复 除法 

图 6-21 显示 了 实现 恢复 除法 的 逻辑 电路 装置 。 注 意 它 与 图 6-7 中 的 乘法 电路 非常 相似 。 操 作 
开始 时 ，zm 位 正 除数 加 载 到 寄存 器 M， 而 "位 正 被 除数 加 载 到 寄存 器 Q。 寄 存 器 A 被 清 零 。 除 法 结 
束 后 ，m 位 的 商 将 存放 在 寄存 器 Q 中 ， 而 余数 则 存放 在 寄存 器 A 中 。 所 需 的 减法 操作 可 以 使 用 补 
码 运算 方便 地 完成 。 A 和 M 附 加 位 位 置 在 减法 过 程 中 存放 符号 位 。 下 面 的 算法 执行 了 恢复 除法 。 

执行 以 下 操作 nm 次 : 

1. 将 A 与 Q 左 移 一 位 。 

2. 从 A 中 减 去 M， 并 将 结果 放 回 A。 

3. 如 果 A 的 符号 为 1， 上 商 qo 为 0， 并 将 M 加 到 A 中 ( 即 恢复 A) ; 否则 上 商 4o 为 1。 

图 6-22 显 示 了 使 用 图 6-21 电 路 进行 4 位 除法 电路 的 例子 。 


n+l 


控制 序列 发 生 器 





图 6-21 二 进 制 除法 的 电路 装置 
不 恢复 除法 
在 不 成 功 的 减法 之 后 避免 恢复 A 的 值 可 以 提高 恢复 除法 的 效率 。 如 果 结 果 为 负 , 则 减法 不 成 功 。 
考虑 前 面 算法 中 减法 操作 之 后 所 发 生 的 操作 步骤 。 如 果 A 为 正 ， 左 移 并 减 去 M， 也 即 执行 2A - M. 
如 果 A 为 负 ， 就 执行 A + M 来 恢复 它 ， 然 后 再 左 移 并 减 去 M。 这 和 执行 2A + M 是 等 价 的 。 正 确 的 操 
作 执 行 后 ，qo 位 就 被 恰当 地 置 为 0 或 1。 我 们 可 以 用 下 面 的 算法 对 不 恢复 除法 作 一 个 总 结 。 
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第 1 步 : 执行 以 下 步骤 m 次 。 
1. 如 果 A 的 符号 为 0， 将 A 和 Q 左 移 一 位 ， 并 用 A 减 去 M; 否则 ， 将 A 和 Q 左 移 ， 并 将 M 加 到 A 
上 。 
2. 现在 ， 如 果 A 的 符号 为 0， 上 商 go 为 1; 否则 ， 上 商 go 为 0。 
第 2 步 : 如 果 A 的 符号 为 1， 将 M 加 到 A 上 。 
在 执行 第 1 步 n 次 之 后 ， 需 要 执行 第 2 步 以 便 在 A 中 设置 适当 的 正 余数 。 图 6-21 的 逻辑 电路 也 
可 以 执行 这 个 算法 。 注 意 ， 这 里 已 经 不 再 需要 恢复 的 操作 ， 而 且 每 一 轮 只 执行 一 次 加 法 或 减法 
操作 。 图 6-23 显 示 了 使 用 不 恢复 除法 计算 图 6-22 中 示例 的 情况 。 
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11) 1000 
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初始 00000 移 位 
00011 z = 
移 位 00001 上 商 4 Q 
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移 位 00100 移 位 00010 
减 l11 101 减 A 1101 
Liig 《020 0.0 1 第 三 个 周期 Eie irni 
移 位 00010 
减 1 1 101 
上 ()1 111 加 LILLI 
pao aan 第 四 个 周期 0 0 0 1 1 
000 10 00010 
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图 6-22 恢复 除法 示例 图 6-23 不 恢复 除法 示例 


没有 与 有 符号 数 乘法 相对 应 的 直接 计算 有 符号 数 除法 的 简单 算法 。 在 除法 中 ， 可 以 将 操作 
数 转 换 为 正 数 。 在 使 用 了 上 面 讨论 的 一 种 算法 之 后 ， 如 果 有 需要 再 将 计算 结果 转换 为 正确 的 有 
符号 数 。 


6.7 浮 点 数 及 其 操作 


到 目前 为 止 我 们 所 处 理 的 都 是 定点 数 ， 而 生还 将 它们 看 作 是 整数 ， 也 就 是 说 ， 数 的 右 端 有 
一 个 隐 含 的 二 进 制 小 数 点 。 也 可 以 假设 小 数 点 正好 在 符号 位 的 右 方 ， 这 样 就 表示 了 一 个 小 数 。 
在 补 码 系统 中 ， 由 "位 二 进 制 小 数 表示 的 有 符号 数 有 为 
B = b.b b b 1 
其 值 F 由 下 式 给 出 





F (B)=~ box X +b. 1 x2 +b-ax 272+ e +b. an x 2-0-D 
F 的 范围 如 下 
-1<F<1-2-0-D 


考虑 以 32 位 有 符号 定点 格式 表示 的 数 的 取 值 范围 。 解 释 为 整数 时 ， 取 值 范围 大 约 为 0 到 
+2.15 x 10>。 如 果 我 们 将 它 看 作 小 数 ， 取 值 范 围 大 约 为 +4.55 x 10- 到 + 1。 在 科学 计算 中 我 们 
可 能 会 接触 到 一 些 参 数 ， 例 如 阿 伏 加 德 罗 (Avogadro's) 常数 (6.0247 x 102 摩尔 -1) 或 者 普 朗 
克 (Planck's) 常量 (6.6254 x 10-7erg . s)， 因 此 上 面 的 两 种 取 值 范围 都 是 不 够 的 。 我 们 需要 容 
易 地 将 非常 大 的 整数 和 非常 小 的 小 数 包含 进来 。 要 做 到 这 一 点 ， 二 进 制 小 数 点 的 位 置 应 该 是 可 
变 的 并 且 随 着 计算 的 进行 自动 调整 ， 而 计算 机 必须 能 够 以 这 种 形式 表示 数字 及 其 操作 。 在 这 种 
情况 下 ， 我 们 说 二 进 制 小 数 点 是 浮动 的 ， 并 称 数字 为 浮 点 数 。 而 定点 数 的 二 进 制 小 数 点 的 位 置 
是 不 变 的 ， 这 是 它们 的 主要 区 别 。 

因为 浮 点 数 中 二 进 制 小 数 点 的 位 置 是 可 以 变化 的 ， 所 以 在 浮 点 表示 中 必须 明确 指出 小 数 点 
的 位 置 。 例 如 ， 在 我 们 熟悉 的 十 进 制 科学 计数 靶 中 ， 数 字 可 以 记 为 6.0247 x 103，6.6254 x 10-7, 
一 1.0341 x 10°, -7.3000 x 10- 04 等 等 。 我 们 说 这 些 数 具有 5 位 有 获 数字 。 它 们 的 比例 因子 〈1022， 
10- ”等 ) 指示 了 相对 于 有 效 数字 的 十 进 制 小 数 点 的 位 置 。 习 惯 上 ， 当 十 进 制 小 数 点 处 于 第 一 个 
GE) 有 效 数字 右 方 时 ， 我 们 说 这 个 数 是 规格 化 的 。 注 意 比 例 因 子 中 的 基数 10 是 固定 的 ， 并 不 
需要 在 浮 点 数 的 机 器 表示 中 明确 出 现 。 符 号 、 有 效 数字 和 比例 因子 中 的 指数 构成 了 浮 点 数 的 表 
示 。 因 此 我 们 可 以 将 浮 点 数 的 表示 定义 为 : 用 符号 、 一 串 有 效 数字 (通常 称 作 尾 数 ) 以 及 对 应 
于 比例 因子 中 隐 含 基数 的 指数 来 表示 一 个 数 的 方法 。 


6.7.1 浮 点 数 的 IEEE 标准 


我 们 从 十 进 制 系统 浮 点 数 的 一 般 格式 和 大 小 出 发 ， 引 出 相应 的 二 进 制 表 示 。 一 个 有 用 的 格 
式 如 下 : 
+ X, XX3X4X5X6X; x 10+ 7172 
其 中 Xi 与 Y; 为 十 进 制 数 。 在 这 个 表示 中 ， 有 效 数字 的 个 数 (7) 和 指数 的 范围 ( + 99) 对 于 大 量 
的 科学 计算 已 经 足够 了 。32 位 (标准 计算 机 字 长 ) 的 二 进 制 表示 可 以 接近 这 个 尾数 精度 和 比例 
因子 范围 。24 位 的 尾数 可 以 大 致 表示 一 个 7 位 十 进 制 数 ， 而 基数 为 2 的 8 位 指数 所 提供 的 比例 因子 
范围 也 比较 合适 。 表 示 数 的 符号 需要 一 个 二 进 制 位 。 因 为 规格 化 二 进 制 尾数 的 前 导 非 零 位 必定 
为 1， 所 以 这 一 位 不 需要 在 表示 中 出 现 。 因 此 ， 总 共 需 要 32 位 。 
这 个 用 32 位 表示 浮 点 数 的 标准 已 经 由 电气 和 电子 工程 师 协会 (IEEE) 中 制定 并 详细 说 明 。 
该 标准 既 描 述 了 表示 方法 ， 也 描述 了 四 种 基本 算术 运算 的 执行 方式 。 图 6-24a 给 出 了 浮 点 数 的 32 
位 表示 。 第 一 位 表示 数 的 符号 ， 接 着 是 比例 因子 (以 2 为 基数 ) 的 指数 表示 方式 。 指 数 域 中 实际 
存储 的 并 不 是 有 符号 的 指数 E， 而 是 一 个 无 符号 整数 E' = E + 127。 这 称 作 余 127 格 式 。 这 样 E 芍 


取 值 范围 为 0< E'< 255。 这 个 范 轧 的 端点 值 0 和 255 用 来 表示 特殊 值 ， 我 们 在 后 面 会 讲 到 。 因 此 EE 


的 正常 取 值 范围 为 1 < E'< 254。 这 音 味 着 实际 指数 E 的 取 值 范 围 为 - 126 < E < 127。 指 数 的 余 x 表 
示 使 我 们 可 以 高 效 地 比较 两 个 浮 点 数 的 相对 大 小 。( 参 见习 题 6.27. ) 

最 后 的 23 位 代表 尾数 。 因 为 使 用 了 二 进 制 规格 化 ， 尾 数 的 最 高 有 效 位 恒 为 1。 这 一 位 没有 
明确 地 表示 出 来 ;我 们 假定 它 在 紧 靠 在 二 进 制 小 数 点 的 左 方 。 这 样 ，M 域 中 存储 的 23 位 实际 上 
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表示 了 尾数 的 小 数 部 分 ， 也 即 二 进 制 小 数 点 右 方 的 各 位 。 图 6-24b 中 显示 了 一 个 单 精度 浮 点 数 
的 例子 。 











32 位 
了 OOO 
数 的 符号 : 余 127 格 式 23 位 尾数 的 
0 代表 + 表示 的 8 位 小 数 部 分 
1! 代表 一 有 符号 指数 , 
代表 的 数值 = +L E 12 
a) 单 精 度 









0 00101000 001010... 
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代表 的 数值 = 1.001010.…0x2 
b) 单 精 度数 示例 








11 位 余 1023 格 式 52 位 尾数 的 
的 指数 小 数 部 分 


代表 的 数值 = +1.M x25 -1023 


c) 双 精 度 
图 6-24 IEEE 标 准 浮 点 格式 


图 6-24a 中 的 32 位 标准 表示 称 为 单 精度 格式 ， 因 为 它 占用 了 一 个 32 位 的 字 。 比 例 因 子 的 范围 
222 到 2"'”， 这 大 致 接近 10*”。24 位 尾数 所 提供 的 精度 与 7 位 十 进 制 值 相仿 。 为 了 提高 浮 点 数 
的 精度 与 取 值 范围 ，IEEE 标 准 还 指定 了 双 精 度 格式 ， 如 图 6-24c 所 示 。 双 精度 格式 增 大 了 指数 与 
尾数 的 取 值 范围 。11 位 余 1023 指 数 E 的 正常 取 值 范 围 为 1< E'< 2046，0 和 2047 用 来 指示 特殊 值 。 
这 样 ， 实 际 指数 E 的 范围 为 -1022< E< 1023 ， 它 所 提供 的 比例 因子 为 从 2-:o2 到 21% (接近 
10:”%)。53 位 尾数 所 提供 的 精度 与 16 位 十 进 制 数 相当 。 

计算 机 必须 至 少 提供 单 精度 表示 以 符合 下 EE 标准 。 双 精度 表示 是 可 选 的 。 标 准 还 规定 了 这 
两 种 表示 的 几 种 可 选 的 扩展 版 本 。 这 些 扩展 版 本 的 目的 是 为 计算 过 程 中 的 中 间 值 表示 提供 更 高 
的 精度 和 更 大 的 指数 范围 。 例 如 ， 两 个 向 量 的 点 乘积 可 以 通过 累加 扩展 精度 的 乘积 和 得 到 。 输 
人 以 标准 精度 表示 ， 即 单 精度 或 双 精度 ， 计 算 结 果 也 截取 为 同样 的 精度 。 使 用 扩展 格式 有 助 于 
减 小 计算 过 程 中 累加 的 舍 人 误差 。 扩 展 格式 还 可 以 提高 基本 函数 如 正弦 、 余 弦 等 的 精确 度 。 除 
了 四 种 基本 的 算术 操作 ， 标 准 还 要 求 提供 余数 、 平 方 根 以 及 二 进 制 与 十 进 制 表示 的 转换 等 操作 。 

请 注意 浮 点 数 操作 的 两 个 基本 方面 。 第 一 ， 如 果 数 字 没有 规格 化 ， 那 么 总 可 以 通过 移 位 小 
数 和 调整 指数 将 它 转化 为 规格 化 格式 。 图 6-25 显 示 了 一 个 非 规格 化 数 0.0010110… x 2?， 以 及 它 
的 规格 化 形式 1.0110… x 26。 因 为 比例 因子 的 形式 为 2， 将 尾数 向 左 或 向 右 移动 一 位 可 以 分 别 通 





过 对 指数 加 1 或 减 1 来 补偿 。 第 二 ， 计 算 过 程 中 可 能 会 产生 正常 数字 表示 范围 之 外 的 数字 。 对 于 
单 精度 ， 这 意味 着 该 数 的 规格 化 表示 中 的 指数 需要 小 于 - 126 或 者 大 于 +127。 在 第 一 种 情况 中 ， 
我 们 说 发 生 了 下 溢 ， 而 在 第 二 种 情况 中 ， 我 们 说 发 生 了 溢出 。 下 溢 与 溢出 都 属于 我 们 将 要 讨论 


余 127 格 式 的 指数 
一 一 一 人 一 





{二进制 小 数 点 左 方 没 有 隐 含 的 1) 
代表 的 值 = +0.0010110 ...x 2° 


a) 未 规格 化 值 


lol1000010110110. 


代表 的 值 = + L0110...x< 2Š 





b) 规格 化 版 本 
图 6-25 IEPEE 单 精度 格式 浮 点 数 规格 化 


特殊 值 

余 127 指 数 E' 的 端点 值 0Oo 和 255 被 用 来 表示 特殊 值 。 当 E' = 0 且 尾 数 的 小 数 部 分 M 也 为 0 时 ， 表 
示 的 是 数值 0。 当 Eg" = 255 且 M = 0 时 ,表示 的 是 值 “ ， 这 里 “是 用 0 去 除 正常 数字 的 结果 。 符 号 
位 仍然 是 表示 的 一 部 分 ， 所 以 存在 上 0 和 + om 的 表示 。 

ŽE = 0 且 M = 0 时 ,表示 了 非 规格 化 数 。 其 值 为 +0.M x 2-'%*。 因 此 它们 比 最 小 的 规格 化 
数 还 要 小 。 这 时 在 二 进 制 小 数 点 的 左 方 没有 隐 含 的 1， 而 M 是 任何 非 零 的 23 位 小 数 。 引 入 非 规 格 
化 数 的 目的 是 实现 过 级 下 溢 ， 为 某 些 处 理 极 小 数值 的 情况 提供 对 可 以 正常 表示 的 数值 范围 的 扩 
展 。 当 E'=255 且 M*0 时 ,表示 的 是 非 数 (或 无 定义 数 ，Not a Number，NaN)。NaN 是 执行 非法 
操作 的 结果 ， 例 如 : 0/0 或 -1。 

异常 

为 了 符合 IEEE 标 准 ， 热 行 操作 时 如 果 发 生 以 下 事件 ， 处 理 器 必须 设置 异常 标志 : Fue. i 
出 、 除 0、 不 精确 和 非法 。 我 们 已 经 讲 过 前 三 种 事件 。 不 精确 描述 的 是 数字 需要 进行 伟人 才能 用 
规范 格式 表示 的 情况 。 非 法 异常 在 执行 0/0 或 -1 操作 时 发 生 。 当 异常 发 生 时 ， 计 算 结果 就 被 设 
为 特殊 值 。 

如 果 人 允许 对 某 个 异常 标志 中 断 ， 当 异常 发 生 时 就 会 进入 系统 或 用 户 定义 的 例 程 。 或 者 ， 如 
果 必 要 ， 程 序 可 以 检测 异常 的 发 生 ， 并 决定 接 下 来 需要 做 什么 。 

对 本 节 与 下 面 丙 小 节 浮 点 问题 更 详细 的 讨论 见 附 录 A 中 的 Hennessy 和 PattersonDl。 


6.7.2 浮 点 数 算术 运算 


本 节 我 们 将 概述 浮 点 数 的 加 、 减 、 乘 、 除 运算 的 基本 步 又 。 所 给 出 的 规则 适用 于 单 精度 
IEEE 标 准 格式 。 这 些 规则 只 说 明了 执行 四 则 运算 的 主要 步骤 ; 例如 ， 我 们 没有 讨论 可 能 发 生 的 
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溢出 或 下 溢 。 还 有 ， 屁 数 与 指数 的 中 间 结 果 需 要 的 位 数 相 能 比 24 和 8 位 更 多 。 在 设计 符合 标准 的 
算术 部 件 时 ， 必 须 认真 考虑 操作 中 的 这 些 问 题 。 尽 管 在 规则 说 明 中 没有 给 出 全 部 的 细节 ， 我 们 
还 是 考虑 了 实现 中 的 一 些 方面 ， 包括 后 面 会 讨论 的 合 入 问题 。 

在 进行 加 减 运算 之 前 ， 如 果 评 点 数 的 尾数 不 同 ， 则 尾数 必须 根据 对 方 进行 移 位 操作 。 考 虚 
一 个 十 进 制 的 例子 ， 将 2.9400 x 10? 与 4.3100 x 10* 相 加 。 我 们 将 2.9400 x 102 重 写 为 0.0294 x 104， 
在 进行 尾数 加 法 从 而 得 到 4.3394 x 104 。 加 减法 的 规则 如 下 : 

加 /减法 规则 

1. 选取 指数 较 小 的 数字 ， 将 其 尾数 右 移 ，、 右 移 的 步 数 等 于 两 指数 之 差 。 

2. 将 结果 的 指数 设 为 与 较 大 的 指数 相等 。 

3. 对 尾数 进行 加 / 减 运算 ， 并 确定 结果 的 符号 。 

4. 如 果 必 要 ， 则 对 结果 的 值 进行 规格 化 。 

乘除 法 比 加 减法 要 简单 些 ， 因 为 它们 不 需要 对 齐 尾数 。 

乘法 规则 

1. 将 指数 相 加 并 减 去 127。 

2. 将 尾数 相 乘 并 确定 结果 的 符号 。 

3. 如 果 必 要 ， 则 对 结果 的 值 进行 规格 化 。 

除法 规则 

1. 将 指数 相 减 并 加 上 127。 

2. 将 尾数 相 除 并 确定 结果 的 符号 。 

3. 如 果 必 要 ， 则 对 结果 的 值 进行 规格 化 。 

在 乘法 与 除法 规则 中 需要 加 / 减 127 是 因为 我 们 对 指数 使 用 余 127 表 示 。 


6.73 保护 位 与 截取 


现在 我 们 来 考虑 一 下 实现 以 上 算法 时 的 一 些 重要 方面 。 尽 管 初始 操作 数 和 最 终结 果 的 尾数 
都 限制 在 24 位 (包括 隐 含 的 前 导 1)， 在 中 间 步 骤 中 保留 一 些 附加 位 ， 通 常 称 为 保护 位 ， 是 非常 
重要 的 。 它 们 使 结果 具有 最 高 的 精确 度 。 

生成 最 终结 果 时 去 除 保护 位 要 求 对 扩展 的 尾数 进行 截取 ， 从 而 获得 接近 扩展 尾数 的 24 位 数 
字 。 在 其 他 一 些 情况 下 也 会 进行 这 一 操作 ， 比 如 将 十 进 制 数 转 换 成 二 进 制 时 。 应 当 指 明 舍 入 也 
可 以 用 于 描述 截取 操作 ， 但 是 在 这 里 我 们 将 舍 和 人 更 严格 地 定义 为 一 种 特定 格式 的 截取 。 

截取 有 几 种 方法 。 最 简单 的 方法 是 将 保护 位 去 除 ， 而 对 剩余 的 各 位 不 加 改变 。 这 种 方式 称 作 
截断 。 假 设 我 们 要 使 用 这 种 方法 将 一 个 小 数 从 六 位 截取 到 三 位 。 区 间 0.2- ib bb 0003|0.b_,b -2b-3 
111 内 的 所 有 小 数 都 将 截取 为 0.b_1b-2b-;。 三 位 结果 的 误差 为 从 0 到 0.000111。 换 句 话说， 截断 误 
差 为 从 0 到 接近 剩余 位 最 低 有 效 位 置 上 的 1。 在 上 面 的 例子 中 ， 该 位 置 就 是 5_: 的 位 置 。 截 断 的 结 
果 是 有 偏 近 似 ， 因 为 误差 区 间 并 不 关于 0 对 称 。 

另 一 种 最 简单 的 截取 方法 是 冯 ， 诺 依 机 合 入 。 如 果 要 去 除 的 各 位 全 为 0, 就 简单 地 去 除 它们 ， 
并 保持 其 他 位 不 变 。 但 是 如 果 要 去 除 的 任何 一 位 为 1， 就 将 剩余 各 位 的 最 低 有 效 位 设 为 1。 在 六 
位 到 三 位 的 截取 例子 由 ， 所 有 2 -已 - 沪 -不 等 于 000 的 小 数 都 被 截取 为 0.5. bl. KARR EW 
误差 在 剩余 位 LSB 位 置 的 - 1 到 +1 之 间 。 尽 管 这 种 技术 的 误差 比 截断 要 大 ,但 误差 的 最 大 值 相 同 ， 





而 且 其 近似 是 无 偏 的 ， 因 为 误差 区 间 关 于 0 对 称 。 

如 果 在 生成 结果 时 涉及 许多 操作 数 和 操作 ， 那 么 无 偏 近似 是 有 利 的 ， 因 为 随 着 计算 的 进行 
正 误差 会 与 负 误 差 相 互 抵 消 。 在 统计 上 ， 复 杂 计 算 的 结果 很 可 能 具有 较 高 的 精确 度 。 

第 三 种 截取 方法 是 倒 入 过 程 。 舍 入 的 结果 最 接近 于 被 截取 的 数字 ， 而 且 是 无 偏 近似 。 其 过 
程 如 下 : 如 果 去 除 位 的 MSB 位 置 上 为 1!， 则 在 保留 位 的 LSB 位 置 上 加 1。 这 样 ，0.b-1b-2b-31… 就 
被 舍 和 成 0.b-1b-2b-3+ 0.001， 而 0.b_15-25-30… 则 被 合 入 为 0.b_-1b5_2b_3。 这 种 方法 提供 了 我 们 需 
要 的 近似 ， 除 了 去 除 位 为 10…0 的 情况 。 这 是 一 个 中 间 状 态 ; 待 截取 的 数字 位 于 两 个 最 近 的 截取 
表示 的 正中 间 。 为 了 无 偏 地 解决 问题 ， 一 种 可 能 是 让 保留 位 设置 为 最 接近 的 偶数 。 对 于 六 位 的 
例子 , 数值 0.b -15-20100 将 被 截取 为 0.b-15-20, 而 数值 0.b_15_21100 则 被 截取 为 0.b6_15_21 + 0.001。 
“在 陷入 僵局 时 含 人 到 最 近 的 数 或 最 近 的 偶数 ”这 句 话 有 时 就 是 描述 这 种 截取 技术 。 误 差 区 间 大 
致 在 保留 位 LSB 位 置 的 - U2 到 +1/2。 很 明显 ， 这 是 最 好 的 方法 。 但 是 ， 它 也 是 最 难 实现 的 ， 因 
为 它 要 求 一 次 加 法 操作 以 及 可 能 的 再 规格 化 。IEEE 浮 点 标准 将 这 种 舍 入 技术 指定 为 截取 操作 的 
默认 模式 。 标 准 规定 了 其 他 的 截取 方法 ， 并 将 所 有 这 些 方 法 称 为 舍 入 模式 。 


这 里 对 通过 截取 去 除 保护 位 引入 误差 的 讨论 只 考虑 了 单独 的 截取 操作 。 当 对 浮 点 数 进 行 一 


系列 很 长 的 计算 时 ， 确 定 最 终结 果 误 差 区 间或 范围 的 分 析 将 会 变 成 复杂 的 研究 。 除 了 对 IEEE 浮 
点 标准 中 保护 位 和 含 人 的 处 理 方式 作 一 些 讨论 之 外 ， 我 们 将 不 再 进一步 讨论 数值 计算 等 方面 。 

单 步 操作 的 结果 必须 精确 于 LSB 位 置 上 单位 的 一 半 。 一 般 情况 下 ， 这 要 求 采用 舍 入 作为 截 
取 方 法 。 实 现 含 人 方法 只 需要 在 执行 操作 的 中 间 步 鸡 中 添加 三 个 保护 位 。 其 中 前 两 位 是 将 被 去 
除 的 昆 数 部 分 中 的 两 个 最 高 有 效 位 。 第 三 位 是 在 尾数 的 完整 表示 中 以 上 两 位 之 后 所 有 各 位 的 逻 
辑 或 。 这 一 位 在 执行 操作 的 中 间 步 又 中 比较 容易 维护 。 它 应 当初 始 化 为 0。 如 果 一 个 1 从 该 位 置 
移出 ， 则 将 这 一 位 设 为 1， 并 保持 该 值 ; 因此 ， 它 通常 被 称 为 粘着 位 。 


6.7.4 浮 点 操作 的 实现 


浮 点 操作 的 硬件 实现 涉及 大 量 的 逻辑 电路 。 这 些 操作 也 可 以 用 软件 例 程 实现 。 不 论 使 用 哪 
种 方式 ， 计 算 机 必须 能 够 将 用 户 十 进 制 表示 的 数字 转换 为 所 需要 的 输入 格式 ， 并 将 输出 转换 为 
十 进 制 表 示 。 大 多 数 通 用 处 理 器 在 机 器 指令 级 提供 浮 点 操作 ， 并 用 硬件 实现 。 

图 6-26 显 示 了 一 个 浮 点 操作 实现 的 例子 。 这 是 具有 图 6-24a 格 式 的 32 位 浮 点 操作 数 加 减 操作 
硬件 实现 的 结构 图 。 按 照 6.7.2 节 中 的 加 /减法 规则 ， 我 们 看 到 第 1 步 是 比较 指数 以 确定 对 具有 较 
小 指数 数字 的 尾数 进行 移 位 的 次 数 。 移 位 次 数 4 由 图 中 左上 角 的 8 位 减法 器 电路 决定 。E% - Ea 之 
差 的 值 " 被 传送 到 SHIFTER ( 移 位 器 ) 部 件 。 如 果 n 大 于 操作 数 的 有 效 位 数目 ， 则 结果 实际 上 就 
是 较 大 的 操作 数 (不 考 虐 合 和 人 中 的 保护 位 与 粘着 位 )， 而 且 可 以 采用 便捷 的 方法 产生 结果 。 对 此 
我 们 不 进行 详细 讨论 。 

比较 指数 所 得 的 差 的 符号 决定 对 哪个 数 的 尾数 移 位 。 因 此 在 第 1 步 中 ， 这 个 符号 被 传人 图 
6.26 右 上 角 的 SWAP (交换 器 ) 网 络 。 如 果 符 号 为 0， 则 Ex > Es, EM, 与 Ms 直接 通过 SWAP 网 
络 。 这 使 得 Me 被 送信 SHIFTER ,并 被 右 移 " 位 。 另 一 个 尾数 Ms 则 被 直接 送 入 尾数 加 法 器 /减法 器 。 
如 果 符 号 为 1， 则 E%< E's ， 在 尾数 送 至 移 位 器 之 前 需要 将 它们 交换 。 

第 2 步 由 图 中 靠近 左下 角 的 多 路 复 用 器 MUX 完 成 。 结 果 的 指数 E' 临时 由 第 1 步 中 指数 比较 所 
得 的 差 的 符号 确定 ， 如 果 E%>E3 则 E’=E%，、 如 果 E%<Es 则 E’= E. 
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图 6-26 浮 点 加 法 /减法 部 件 


第 3 步 涉及 到 了 主要 组 件 一 一 图 中 部 的 尾数 加 法 器 /减法 器 。CONTROL (控制 ) 逻辑 确定 尾数 
是 相 加 还 是 相 减 。 这 由 操作 数 的 符号 (54 与 5s) 和 操作 数 上 执行 的 操作 (加 或 减 ) 决定 。 
CONTROL 多 辑 还 决定 结果 Sx 的 符号 。 例 如 ， 如 果 4 为 负 (S54=1), BHE ($s=0), 且 操作 为 4 一 B， 
则 需要 对 尾数 执行 加 法 且 结 果 的 符号 为 负 (Sk = 1)。 反 之 ， 如 果 4 和 B 都 为 正 ， 且 操作 为 4- 有， 则 
需要 将 尾数 相 减 。 现 在 结果 的 符号 S 依 赖 于 尾数 的 相 减 操作 。 例 如 ， 如 果 E4 > E's, MMi- ( 移 
位 的 Ms) 为 正 ， 因 而 结果 为 正 。 从 这 个 例子 可 以 看 出 ， 指 数 比 较 所 得 的 符号 也 需要 作为 
CONTROL 网 络 的 输入 。 当 E% = E's 且 指 数 相 减 时 ， 尾 数 加 法 器 /减法 器 输出 的 符号 决定 了 结果 的 
符号 。 读 者 现在 应 该 可 以 为 CONTROL 网络 构造 完整 的 真 值 表 了 。 

加 /减法 规则 的 第 4 步 是 对 第 3 步 的 结果 尾数 M 进 行规 格 化 。M 中 前 导 0 的 数目 决定 了 对 对 的 移 
位 次 数 X。 规 格 化 的 值 被 截取 从 而 生成 24 位 的 结果 尾数 Mr。 临时 结果 的 指数 E' 也 需要 减 去 值 X， 








生成 真正 的 结果 指数 E'x*。 注 意 ， 可 能 只 需要 右 移 一 位 就 可 以 对 结果 规格 化 。 两 个 形式 为 1.xx… 
的 尾数 相 加 时 就 会 发 生 这 种 情况 。 这 时 M 向 量具 有 1x.xx… 的 形式 ， 这 对 应 于 图 中 X 的 值 为 - 1 的 
情况 。 

对 于 中 间 尾 数值 必须 附带 的 保护 位 ， 我 们 没有 给 出 任何 细节 。 在 IEEE 标 准 中 、 如 前 所 述 ， 
生成 结果 中 的 24 位 规格 化 尾数 只 需要 几 个 保护 位 即 可 。 

让 我 们 考虑 一 下 实现 6-26 结 构图 所 需要 的 实际 硬件 。 如 前 所 述 ， 两 个 8 位 减法 器 和 尾数 加 法 
器 /减法 器 可 以 使 用 组 合 逻 辑 实现 。 因 为 它们 必须 以 原 码 的 形式 输出 ， 因 此 对 前 面 的 讨论 做 一 些 
修改 。 经 常 需 要 使 用 反 码 运 算 与 原 码 表示 的 组 合 。SHIFTER 和 输出 规格 化 操作 的 实现 允许 有 极 
大 的 灵活 性 。 如 果 设 计 需 要 使 逻辑 门 数 达到 最 小 、 那 么 可 以 使 用 移 位 寄存 器 实现 操作 。 然 而 ， 
为 了 达到 高 性 能 ， 也 可 以 将 它们 构造 为 组 合 逻 辑 部 件 ， 但 是 这 样 会 需要 大 量 的 逻辑 门 、 在 高 性 
能 处 理 器 中 ， 相 当 数 量 的 芯片 区 域 是 用 于 浮 点 操作 的 。 


68 结束语 


计算 机 的 算术 运算 涉及 儿 个 非常 有 趣 的 逻辑 设计 问题 。 本 章 讨论 了 一 些 在 二 进 制 算术 部 件 
设计 中 有 实用 价值 的 技术 。 超 前 进位 技术 是 高 性 能 加 法 器 设计 的 主要 思想 。 在 快速 乘法 器 设计 
中 ， 由 Booth 算 法 发 展 而 来 的 乘 数 位 偶 重 编码 减少 了 生成 乘积 所 需求 和 项 的 数目 。 进 位 保留 加 法 
显著 地 减少 了 求 和 项 加 法 所 需 的 时 间 。 

本 章 介绍 了 浮 点 数 的 IEEE 表 示 标 准 ， 以 及 执行 四 则 运算 的 基本 规则 。 为 了 考察 评点 操作 实 
现 电路 的 复杂 性 ， 我 们 讨论 了 加 法 /减法 部 件 。 


习题 


6.1 下 列 加 减法 问题 中 的 数字 为 补 码 表 示 的 6 位 有 符号 数 。 执 行 题目 中 指示 的 操作 ， 说 明 是 否 
发 生 了 算术 溢出 ， 然 后 将 操作 数 与 结果 转换 为 十 进 制 原 码 的 表示 形式 ， 以 检查 答案 的 正确 
性 。 


010110 101011 111111 
+001001 +100101 +000111 


011001 110111 010101 
+010000 +111001 +101011 


010110 111110 100001 
—011111 —100101 -—011101 


114111 000111 011010 
-000111 —111000 —100010 


6.2 6.7 小 节 的 开始 讨论 了 补 码 表示 的 有 符号 二 进 制 小 数 。 
(a) 将 二 进 制 数值 05，- 0.123，- 0.75 和 -- 0.1 表 示 为 6 位 小 数 。( 参 阅 附录 E 中 的 十 进 制 到 二 
进 制 小 数 转换 。) 


(b) 当 二 进 制 小 数 点 后 使 用 5 位 有 效 数字 时 ， 最 大 表示 误差 e 是 多 少 ? 
O 计算 使 e 符 合 以 下 条 件 时 二 进 制 小 数 点 后 所 需 的 有 效 数字 位 数 : 


+ 


403 





6.3 


6.4 


6.5 


6.6 


6.7 


6.8 


6 _—_ 6 


1 
< — 
@ “<j0 


1 
b) e<- 
(b) e< T00 





(c) e< 1000 


1 
(d) e< 
反 码 与 补 码 二 进 制 表示 方法 是 以 8 为 基数 的 数字 系统 中 〈(b - 1) 进 制 补 码 和 2 进 制 补 码 表 示 
技术 的 特例 。 例 如 ， 考 虑 十 进 制 系统 。 以 原 码 形式 表示 的 数字 +526、- 326、+70 和 -70% 
两 个 补 码 系统 中 都 有 4 位 原 码 表示 ， 如 图 P6-1 所 示 。 数 字 的 每 一 位 对 9 取 补 就 构成 了 九 进 制 
补 码 。 对 九 进 制 补 码 加 1 就 构成 了 十 进 制 补 码 。 在 下 面 的 两 种 表示 中 ， 正 数 的 最 左 位 为 0， 
负数 的 最 左 位 为 9。 


表示 示例 


符号 数值 -526 +70 


九 进 制 补 码 9473 — 0070 
十 进 制 补 码 9474 





-图 P6-1 习题 6.3 中 以 10 为 基数 的 有 符号 数 


现在 考虑 基数 为 3 的 系统 (三 进 制 系统 )， 其 中 5 位 无 符号 数 bb WEH ux 34th x3 +h 
x3+nx3+tax30<6s2。 将 原 码 表示 的 三 进 制 数 +11011、- 10222, +2120, -1212, 
+10 和 一 201 表 示 为 三 进 制 补 码 系 统 中 的 6 位 有 符号 三 进 制 数 。 

将 十 进 制 数 565、- 37、122 和 - 123 表 示 为 三 进 制 补 码 格式 的 6 位 有 符号 数 ， 对 所 有 可 能 的 配 
对 进行 加 减 操作 ， 并 对 每 个 操作 说 明 是 否 出 现 了 算术 溢出 。( 参 见习 题 6.3 对 三 进 制 数 系统 的 
定义 ， 并 使 用 类 似 于 附录 BE 中 十 进 制 到 三 进 制 整数 转换 的 技术 。 ) 

半 加 器 (half adder) 是 一 个 组 合 逻 辑 电 路 ， 它 有 两 个 输入 x 与 y， 以 及 两 个 输出 s 与 c<， 分 别 是 
x 与 y 相 加 所 得 的 和 与 进位 输出 。 

(a) 采用 二 级 与 或 电路 设计 一 个 半 加 器 。 

(b) 说 明 如 何 使 用 两 个 半 加 器 以 及 必要 的 外 部 逻辑 门 实现 图 6-2a 中 的 全 加 器 。 

(c) 比较 (b) 部 分 的 网 络 和 图 6-2a 中 的 加 法 器 网 络 的 最 长 逻辑 延迟 路 径 。 

编写 一 个 68000 或 1A-32 程 序 ， 将 16 位 正二 进 制 数 转换 为 5 位 BCD 码 十 进 制 数 。BCD 数 字 编 码 
占用 内 存 中 五 个 连续 字 节 的 低 4 位 。 使 用 连续 除 10 的 转换 技术 。 这 个 方法 类 似 于 附录 E 中 十 
进 制 到 二 进 制 转换 时 的 连续 除 2。 参 考 附 录 C (68000) 或 D (IA-32) 中 除法 指令 的 格式 与 
操作 。 

假设 表示 0 到 9999 的 十 进 制 整数 的 四 个 BCD 数 被 装载 到 32 位 内 存 区 域 DECIMAL 的 低 16 位 。 
编写 一 个 ARM、68000 或 IA-32 子 程序 , 将 DECIMAL 中 存储 的 十 进 制 整数 转换 为 二 进 制 表 示 ， 
并 存 人 内 存 区 域 BINARY。 

对 BCD 数 求 和 需要 模 10 加 法 器 。 两 个 BCD 数 4 = AAA Ao 和 B = B38B2B1B0 的 模 10 加 法 执行 如 





6.9 


6.10 


6.1 


—_ 


6.12 
6.13 
6.14 


6.17 


6.18 
6.19 


6.20 


F: 将 4 加 到 B 上 (二 进 制 加 靶 )。 之 后 ， 如 果 结 果 为 大 于 或 等 于 10 的 非法 编码 ， 则 加 6o。 
(忽略 本 次 加 法 的 溢出 。) 
(a) 什么 时 候 输 出 进位 等 于 1? 
(b) 证 明 本 算法 对 于 以 下 数值 可 以 给 出 正确 结果 : 
(1)A=0101 B=0110 
(2)4=0011 B=0100 
(c) 使 用 4 位 二 进 制 加 法 器 以 及 必要 的 外 部 逻辑 门 设计 一 个 BCD 数 加 法 器 。 输 入 为 43424140、 
B3B2B1Bo 与 进位 输入 。 输 出 为 和 数 53525156 与 进位 输出 。 级 联 这 样 的 组 件 可 以 构成 行 波 进位 
BCD 加 法 器 。 
使 用 适当 的 真 值 表 证 明 ， 在 补 码 整 数 加 法 中 ， 罗 辑 表达 式 cv. Dcr- (正确 地 指示 了 溢出 的 发 
生 。 
(a) 使 用 四 个 图 6-5 中 16 位 超前 进位 加 法 器 以 及 附加 逻辑 设计 一 个 64 位 加 法 器 ， 从 图 中 的 
co、Gr” 和 P" 变量 生成 ce、ca、cs 和 ces。 附 加 逻辑 与 图 中 每 个 超前 进位 加 法 器 内 部 逻辑 有 
什么 关系 ? 
(b) 证 明 6.2.1 小 节 末 尾 的 结论 ， 通 过 64 位 加 法 器 的 延迟 对 se 为 12 个 门 延迟 ， 对 ce 为 7 个 门 
ER. 
(c) 比较 (a) 部 分 中 64 位 加 法 器 与 6.2.1 小 节 讨 论 的 使 用 两 个 16 位 加 法 器 级 联 构成 的 32 位 加 法 
器 生成 wx 和 ca 的 门 延 迟 。 
(a) 构建 图 6-4 中 的 4 位 超前 进位 加 法 器 需要 多 少 逻 辑 门 ? 
(b) 使 用 (a) 部 分 的 适当 结果 计算 构建 图 6-5 中 的 16 位 超前 进位 加 法 器 需要 多 少 逻 辑 门 。 
证 明 6.3 小 节 的 结论 ， 通 过 图 6-6b 中 的 n x n 阵 列 最 坏 情 况 的 延迟 为 6 (n - 1) - 1 个 门 延迟 。 
用 手工 方法 计算 5 位 无 符号 数 4 = 10101 和 B = 00101 上 的 操作 4 x B 与 4 + B. 
创建 与 图 6-7b 和 图 6-23 类 似 的 图 表 ， 说 明 习 题 6.13 中 的 乘除 法 操作 是 如 何 使 用 图 6-7a 和 图 6-21 
的 硬件 执行 的 。 
编写 ARM、68000 或 IA-32 程 序 ， 模 仿 图 6-7 中 的 技术 计算 两 个 32 位 无 符号 数 的 乘法 。 假 设 
乘 数 与 被 乘 数 分 别 在 寄存 器 Re 和 Rs: 中。 乘积 将 存 人 寄存 器 R (高 位 部 分 ) AR (低位 部 分 )。 
(提示 : 使 用 移 位 与 循环 移 位 的 组 合 进行 双 寄 存 器 移 位 。) 
编写 ARM、68000 或 IA-32 程 序 ， 基于 不 恢复 除法 算法 计算 整数 除法 。 假设 两 个 操作 数 均 为 
正 数 ， 即 被 除数 和 除数 的 最 左 位 为 0。 
使 用 Booth 算 法 计算 以 下 各 对 有 符号 补 码 数 的 乘法 。 假 设 4 为 被 乘 数 ，B 为 乘 数 。 
(a) A =01011}1 B=110110 
(b) A= 110011 B=101100 
(c)A=110101 B=011011 
(d) A =001111 B=00111i 
使 用 乘 数位 偶 重 编码 重复 习题 6.17， 
概括 地 说 明 怎样 修改 图 6-7a 中 的 电路 图 ， 使 其 使 用 Booth 算 法 实现 位 补 码 有 符号 数 乘法 。 
明确 指出 控制 序列 发 生 器 (Control sequencer) 的 输入 和 输出 ， 以 及 对 加 法 器 和 A 寄 存 器 所 
如 果 两 个 na 位 补 码 有 符号 数 的 乘积 可 以 用 nm 位 表示 ， 则 图 6-6a 中 的 手工 要 乘 算 法 就 可 以 直接 
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6.2 
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6.22 


6.23 


6.24 


6.25 


OË 


使 用 ， 这 时 将 符号 位 与 其 他 位 同等 对 待 。 对 下 面 的 两 对 4 位 有 符号 数 进行 乘法 计算 : 

(a) 乘 数 = 1110 被 乘 数 = 1101 

(b) 乘 数 = 0010 ”被 乘 数 = 1110 
为 什么 这 时 的 计算 是 正确 的 ? 
一 个 能 够 计算 16 位 无 符号 数 加 法 和 乘法 的 整数 运算 部 件 可 以 用 来 计算 两 个 32 位 无 符号 数 的 
乘法 。 所 有 的 操作 数 、 中 间 结 果 和 最 终结 果 存 储 于 标号 为 Re 到 Ri; 的 寄存 器 中 。 硬 件 乘法 器 
HR (被 乘 数 ) 5R ( 乘 数 ) 相 乘 ， 并 将 32 位 的 乘积 存 人 寄存 器 R 和 Ri , !， 其 中 低位 部 分 
存 人 Ri。 当 /| = i- 1 时， 乘积 将 覆盖 两 个 操作 数 。 硬 件 加 法 器 将 R, 与 Ri 的 内 容 相 加 并 将 结果 
FAR; 。 加 法 操作 的 进位 输入 为 0， 而 有 进位 加 法 操作 的 进位 输入 为 进位 标志 C 的 值 。 加 法 
器 的 进位 输出 总 保存 在 C 中 。 
说 明 计 算 R,、Ro 和 Rs、Rz 中 两 个 32 位 操作 数 (高 位 部 分 在 前 ) 乘法 的 步骤 ， 将 64 位 的 乘积 
放 人 寄存 器 Ris、Ri4、Ri 和 Ra 中。 如果 需 要 ，Ru 到 R4 的 任何 寄存 器 都 可 以 用 来 保存 中 间 
结果 。 过 程 中 的 每 一 步 可 以 是 乘法 、 加 法 或 寄存 器 传输 操作 。 
(a) 计算 图 6-16 中 每 个 阵列 生成 乘积 位 p; 的 延迟 ， 即 还 辑 门 延迟 。 假 设 全 加 器 在 输入 加 载 两 
个 门 延迟 后 可 以 得 到 所 有 输出 。 包 括 开始 时 生成 所 有 mg 乘积 的 与 门 延 迟 。 
(b) 6.4 小 节 说 明了 将 图 6-16a 扩 展 为 n x a 阵列 的 延迟 为 6 (n 一 1) 一 1。 为 将 图 6-16b 扩 展 为 4 x n 
阵列 生成 类 似 的 表达 式 。 
将 k 个 求 和 项 减少 为 两 个 向 量 所 需 的 进位 保留 加 法 步骤 数 为 1.7log2ak — 1.7， 推 导 这 一 公式 。 
(这 个 公式 在 6.5.2 节 给 出 ， 但 没有 推 必 。) 
(a) 使 用 与 图 6-19 相 似 的 模式 ， 将 16 个 求 和 项 降 为 两 个 需要 多 少 层 CSA 操 作 ? 
(b) 画 出 将 32 个 求 和 项 降 为 两 个 的 模式 图 ， 以 证 明 6.5.2 节 八 层 的 结论 是 正确 的 。 
(c) 比较 (a) 与 (b) 部 分 的 精确 答案 与 从 1.7log2k — 1.7 得 出 的 近似 答案 。 
在 6.7 节 中 ,我们 使 用 了 实用 的 32 位 IEEE 标 准 格式 来 表示 浮 点 数 。 这 里 使 用 一 种 缩短 格式 ， 
它 保 持 了 全 部 相关 的 概念 ， 但 是 便于 完成 数字 练习 。 考 虑 用 图 P6-2 中 的 12 位 格式 表示 浮 点 
数 。 隐 含 基 数 为 2 的 比例 因子 为 位， 指数 为 余 15 格 式 ， 其 中 两 个 端点 值 0 和 31 分 别 表示 数 
值 0 和 无 穷 大 。6 位 尾数 使 用 正 EE 格 式 规格 化 ， 二 进 制 小 数 点 的 左边 有 一 个 隐 含 的 1。 


12 位 
| | 


一 一 一 一 





_ | 5 位 余 6 位 小 数 部 
kau au 15 指 数 分 的 尾数 
RÆ- 


图 P6-2 习题 6.25 中 的 浮 点 数 格式 
(a) 将 数字 十 1.7、 一 0.012、+19 和 1/8 表 示 为 这 种 格式 。 
(b) 这 种 格式 所 能 表示 的 最 小 和 最 大 值 是 多 少 ? 
(c) 比较 (b) 部 分 计算 的 区 间 范 围 与 12 位 有 符号 整数 、12 位 有 符号 小 数 的 表示 范围 。 
(d) 对 如 下 的 操作 数 4 和 8 执行 四 则 运算 : 
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A=| 0 | 10001 | 011011 | 


B =| I | on | 101010 | 


车 虑 用 类 似 习 题 6.25 格 式 表 示 的 16 位 浮 点 数 ， 它 具有 6 位 指数 和 9 位 规格 化 小 数 尾数 。 比 例 
因子 的 基数 为 2， 指 数 采 用 余 31 格 式 表示 。 
(a) 将 以 下 格式 的 4 和 8 相 加 : 











A =| of 100001 | 111111110 | 


B =| o | ou | 001010101 | 








将 答案 转换 为 规格 化 格式 。 记 住 二 进 制 小 数 点 左 方 隐 含 的 1 并 不 包含 在 4 和 8 的 格式 中 。 在 


生成 最 终 的 9 位 规格 化 尾数 时 使 用 伟人 。 
(b) 使 用 十 进 制 数 w、 x、y 和 ?表示 前 面 规 格 化 浮 点 数 格式 所 能 表示 的 最 大 值 与 最 小 (GEF) 
值 。 使 用 下 面 的 格式 | | 

最 大 值 =w x 2* 

最 小 值 =yx2- 
在 图 6-24a 浮 点 数 表 示 中 ， 指 数 的 余 x 表 示 为 比较 两 个 浮 点 数 的 相对 大 小 提供 了 什么 便利 ? 
(提示 : 假设 有 一 个 组 合 逻 辑 网 络 可 以 比较 两 个 32 位 无 符号 整数 的 相对 大 小 。 使 用 这 一 网 
络 以 及 必要 的 外 部 逻辑 门 设计 比较 浮 点 数 所 需 的 网 络 .) 
在 习题 6.25a 中 ， 简 单 十 进 制 数 到 二 进 制 浮 点 数 的 转换 是 直接 的 。 但 是 ， 如 果 十 进 制 数 是 用 
浮 点 格式 表示 的 ， 转 换 就 不 是 直接 的 了 ， 这 是 因为 我 们 不 能 单独 转换 比例 因子 的 尾数 与 指 
数 ， 因 为 10' = 2 一 般 并 不 能 保证 zx 和 ?为 整数 。 假 设计 算 机 中 存储 着 一 个 表 ， 表 中 的 二 进 制 
U FK ti 和 xi 的 关系 为 4 = 10* 。 请 说 明 将 给 定 的 十 进 制 浮 点 数 转换 为 二 进 制 浮 点 格式 的 一 
般 步 又 。 可 以 使 用 计算 机 中 的 整数 和 浮 点 数 指令 。 
将 十 进 制 数 0.1 表 示 为 在 6.7 节 开始 时 讨论 的 8 位 有 符号 二 进 制 小 数 格式 。 如 果 读 数字 不 能 正 
好 转换 为 8 位 格式 ， 使 用 6.7.3 节 讨论 的 所 有 三 种 截取 方法 对 数字 作 近 似 处 理 。 
构建 一 个 实例 ， 说 明 当 两 个 正 数 相 减 时 获得 正确 的 结果 需要 三 个 保护 位 。 
习题 6.2a 中 的 四 个 6 位 答案 哪些 是 不 精确 的 ?对 每 一 个 答案 ， 给 出 与 6.7.3 节 定义 的 三 种 截取 
方法 相对 应 的 三 个 6 位 值 。 
为 图 6-26 中 组 合 控 制 网 络 的 输出 Add/Sub (WIR) 和 Sk 推 导 逻 辑 等 式 。 
如 果 门 的 扁 入 为 4， 如 何 组 合 构成 图 6-26 中 的 SHIFTER ( 移 位 器 ) ? 
(a) 画 出 实现 图 6-26 中 的 多 路 复 用 器 MUX 的 逻辑 门 网 络 。 
(b) 将 图 6-26 中 的 SWAP (交换 器 ) 网 络 结构 与 (a) 部 分 的 答案 相 联 。 
如 何 组 合 实现 图 6-26 中 的 前 导 0 检 而 路 ? 
图 6-26 中 的 尾数 加 法 器 /减法 器 对 正 的 无 符号 二 进 制 小 数 操作 ， 而 且 必 须 以 原 码 的 形式 给 出 
结果 。 在 对 图 6-26 的 讨论 中 我 们 说 过 对 于 输入 和 输出 操作 数 所 需 的 格式 ， 反 码 运算 是 非常 
方便 的 。 当 两 个 有 符号 数 反 码 相 加 时 ， 必 须 将 符号 位 的 进位 输出 加 到 结果 中 才能 得 到 正确 
答案 。 这 被 称 为 循环 进位 校正 (end-around carry correction )。 图 P6-3 中 的 两 个 示例 使 用 4 位 
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有 符号 反 码 对 操作 数 和 答案 编码 ， 并 展示 了 加 法 操作 。 

当 需 要 以 原 码 形式 生成 结果 时 ， 反 码 运算 系统 是 非常 方便 的 ， 因 为 以 反 码 形式 表示 的 负数 
可 以 通过 对 符号 位 右 方 的 各 位 求 补 转换 为 原 码 形式 。 而 使 用 补 码 运算 ， 将 负数 转换 为 原 码 
形式 时 需要 加 入 +1。 如 果 使 用 超前 进位 加 法 器 ， 可 以 将 反 码 运算 所 需 的 循环 进位 操作 结 
合 到 超前 逻辑 当中 。 请 以 上 述 讨 论 为 指导 ， 给 出 图 6-26 中 反 码 加 法 器 /减法 器 的 完整 设计 。 


O 00 1 1 (6) 01 1 0 
+(-5) +O 1601560 +(-3) +I loli0o0o 
-2 11 1 O 1 3 0010 
11 O 1 00 1 1 


图 P6-3 习题 6.36 中 的 反 码 加 法 
参考 文献 


1. Institute of Electrical and Electronics Engineers, IEEE Standard for Binary 
Floating-Point Arithmetic, ANSVIEEE Standard 754-1985, August 1985. 


2. J.L. Hennessy and D.A. Patterson, Computer Architecture 一 A Quantitative 
Approach, 2nd ed., Morgan Kaufmann, San Francisco, CA, 1996. 





第 7 章 


基本 处 理 部 件 


本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

“ 处 理 器 如 何 执行 指令 

* 处理 器 的 内 部 功能 部 件 以 及 这 些 部 件 如 何 互 连 
“ 用 于 产生 内 部 控制 信号 的 硬件 

“ 微 程序 设计 方法 

* 微 程序 结构 


在 本 章 和 下 一 章 我 们 主要 讨论 处 理 部 件 ， 该 部 件 的 主要 功能 是 执行 机 器 指令 以 及 协调 其 他 
部 件 的 活动 ， 一 般 称 为 指令 集 处 理 器 (ISP) 或 简称 为 处 理 器 。 下 面 来 查看 该 部 件 的 内 部 结构 以 
及 它 是 如 何 完成 指令 读 取 、 指 令 译 码 和 执行 程序 中 的 指令 的 。 以 前 我 们 将 处 理 器 部 件 叫 做 中 央 
处 理 器 (CPU)， 由 于 许多 现代 计算 机 系统 中 包含 有 多 个 处 理 器 部 件 ， 所 以 今天 再 使 用 术语 “中 
央 ” 就 有 些 欠 妥 了 。 

随 着 技术 不 断 发 展 ， 性 能 要 求 不 断 提高 ， 使 得 处 理 器 的 结构 逐年 发 生变 化 。 开 发 高 性 能 处 
理 器 的 一 种 通用 方法 是 尽量 使 各 种 功能 部 件 的 操作 能 够 并 行 处 理 。 在 高 性 能 处 理 器 中 一 般 都 包 
含有 流水 线 结构 ， 它 能 够 实现 在 前 一 条 指令 的 执行 结束 之 前 开始 执行 另 一 条 指令 。 另 外 一 种 方 
法 称 为 超标 量 操作 ， 它 可 以 同时 完成 多 条 指令 的 读 取 和 执行 操作 。 流 水 线 和 超标 量 体 系 结构 我 
们 在 第 8 章 中 讨论 。 本 章 将 主要 对 各 种 处 理 器 都 通用 的 基本 思想 进行 讨论 。 

一 个 典型 的 计算 任务 由 组 成 程序 的 一 系列 机 器 指令 所 指定 的 执行 步骤 构成 。 一 条 指令 的 执 
行 由 一 系列 基本 的 操作 构成 ， 这 些 操作 及 其 控制 方式 是 本 章 讨论 的 主要 内 容 。 


7.1 一 些 基 本 概念 


在 程序 的 执行 过 程 中 ,处 理 器 一 次 取出 一 条 指令 并 执行 指定 的 操作 。 除 非 遇 到 转移 指令 或 
跳 转 指 令 ， 否 则 ， 指 令 从 连续 的 存储 器 单元 中 进行 读 取 。 处 理 器 利用 程序 计数 器 PC 来 跟踪 将 要 
取出 的 下 一 条 指令 的 存储 地 址 。 指 令 取出 以 后 ，PC 的 内 容 将 用 指令 序列 中 的 下 一 条 指令 地 址 进 
行 更 新 。 但 是 转移 指令 可 能 会 打破 这 种 取 值 顺序 ， 为 PC 提供 一 个 转移 到 目标 处 的 指令 地 址 。 

处 理 器 中 另 一 关键 寄存 器 是 指令 寄存 器 不 。 假 设 每 条 指令 包含 4 个 宝 节 并 且 保 存在 一 个 存储 
器 字 中 。 为 了 执行 一 条 指令 ， 处 理 器 必须 完成 下 列 三 步 : 

1. 取出 PC 指向 的 存储 器 单元 的 内 容 ， 该 单元 中 的 内 容 是 将 要 执行 的 指令 ， 因 而 装 入 了 下 。 采 
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用 符号 标记 形式 ， 可 以 写成 


IR-[[PC]] 
2. 假设 存储 器 是 按 字 节 寻 址 的 ， 那 么 PC 内 容 增 4， 即 
412 PC-[PC]+4 


3. 执行 下 中 指令 所 规定 的 操作 。 

当 一 条 指令 超过 一 个 字 时 ， 必 须根 据 需要 将 步 又 1 和 2 重复 多 次 以 便 将 指令 完整 地 取出 。 这 
两 步 通常 称 为 取 指 令 阶段 ; 第 3 步 称 为 执行 阶段 。 

为 了 更 详细 地 研究 这 些 操 作 ， 我 们 首先 来 了 解 处 理 器 的 内 部 构造 。 在 图 1-2 中 我 们 介绍 过 处 
理 器 的 主要 模块 ,它们 可 以 采用 各 种 方法 进行 组 织 和 互 连 。 先 从 一 个 简单 结构 开始 ， 在 本 章 的 后 
续 部 分 以 及 在 第 8 章 中 将 介绍 一 些 用 来 提高 性 能 的 较 复杂 结构 。 图 7-1 给 出 的 结构 中 算术 逻辑 部 
fF (ALU) 和 所 有 寄存 器 是 通过 普通 单 总 线 互 连 起 来 的 ， 该 总 线 是 处 理 器 内 部 总 线 ， 不 要 与 连 
接 处 理 器 和 存储 器 及 MO 设备 的 外 部 总 线 相 混 消 。 





内 部 处 理 器 总 线 
控制 信号 
P | — À. — 
指令 译 码 器 


和 控制 逻辑 


AU 
控制 线 ， 


+ 
一 
O 


图 7-! 处 理 器 内 部 数据 通路 的 单 总 线 结构 
外 部 存储 器 总 线 中 的 数据 线 与 地 址 线 通 过 存储 器 数据 寄存 器 MDR 和 地 址 寄存 器 MAR 分 别 连 
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接 到 内 部 处 理 器 总 线 上 ， 如 图 7-1 所 示 。MDR 寄 存 器 有 两 个 输入 和 两 个 输出 ， 数 据 可 以 从 存储 器 
总 线 或 内 部 处 理 器 总 线装 入 到 MDR 中 ，MDR 中 的 数据 可 放 在 任何 一 条 总 线 上 。MAR 的 输入 连 
接 到 内 部 总 线 ， 输 出 连接 到 外 部 总 线 。 存 储 器 总 线 的 控制 线 与 指令 详 码 器 和 控制 逻辑 模块 相连 。 
控制 处 理 器 内 部 所 有 部 件 的 操作 信号 以 及 存储 器 总 线 之 间 的 交互 信号 ， 都 是 由 该 部 件 负 责 的 。 

处 理 器 寄存 器 RO 到 R (n-1) 的 编号 和 用 法 在 不 同 的 处 理 器 中 是 各 不 相同 的 ， 程 序 员 可 将 寄存 
器 作为 通用 寄存 器 使 用 ， 其 中 某 些 可 以 指定 为 专用 寄存 器 ， 例 如 变 址 寄存 器 和 堆栈 寄存 器 。 图 
7-1 中 的 Y，Z 和 TEMP 三 个 寄存 器 以 前 没 提 到 过 。 这 些 寄 存 器 对 程序 员 是 透明 的 ， 即 程序 员 不 必 
在 意 它 们 ， 因 为 它们 从 未 被 任何 指令 明确 地 引用 过 。 主 要 作用 是 在 某 些 指令 执行 期 间 ， 由 处 理 
器 作为 临时 寄存 器 使 用 的 。 这 些 寄存 器 从 不 用 来 存储 由 某 条 指令 产生 并 在 之 后 被 其 他 指令 使 用 
的 数据 。 

多 路 复 用 器 MUX 可 以 选择 寄存 器 Y 的 输出 或 是 选择 作为 ALU 输 入 端 A 的 输入 常量 4。 这 个 常 
晤 4 用 来 对 程序 计数 器 的 内 容 增值 。 我 们 把 MUX 控 制 输 入 选择 的 两 种 可 能 值 记 作 Select4 和 
SelectY， 分 别 表示 选择 常量 4 或 选择 寄存 器 Y。 

在 指令 执行 的 过 程 中 ， 数 据 从 一 个 寄存 器 传送 到 另 一 寄存 器 上 时， 通常 要 经 过 ALU 来 实现 一 
些 算术 和 风 辑 操作 。 指 令 译 码 器 和 控制 逻辑 单元 负责 完成 人 寄存 器 中 指令 所 指定 的 操作 。 译 码 
器 产生 所 需要 的 控制 信号 来 选择 所 涉及 的 寄存 器 并 指导 数据 的 传送 。 寄 存 器 、ALU 和 互 连 总 线 
总 体 被 称 为 数据 通路 。 

除了 少量 情况 以 处 ， 一 条 指令 可 以 通过 按 某 种 指定 的 顺序 执行 以 下 一 个 或 多 个 操作 来 完成 : 

" 从 一 个 处 理 器 寄存 器 向 另 一 寄存 器 或 ALU 传 送 一 个 宇 长 的 数据 。 

` 执行 算术 或 逻辑 运算 并 将 结果 保存 到 处 理 器 寄存 器 中 。 

“ 取出 指定 存储 器 单元 的 内 容 将 其 装 入 到 处 理 器 寄存 器 中 。 

“ 将 处 理 器 寄存 器 中 一 个 字 长 的 数据 保存 到 指定 的 存储 单元 中 。 

现在 我 们 采用 图 7-1 的 简单 处 理 器 模型 ， 有 具体 考虑 这 些 操作 中 的 每 一 种 操作 是 如 何 实现 的 。 


”7.1.1 寄存 器 传送 


指令 执行 中 包括 一 系列 操作 步骤 ， 这 期 间 数据 在 寄存 器 之 间 不 断 传送 。 每 个 寄存 器 都 使 用 
两 种 控制 信号 ， 其 中 一 种 信号 用 来 将 寄存 器 的 内 容 放 到 总 线 上 ， 另 一 种 信号 用 来 将 总 线 上 的 数 
据 装 和 寄存 器 中 。 在 图 7-2 中 我 们 给 出 了 表示 的 符号 。 寄 存 器 Ri 的 输入 和 输出 分 别 经 由 信号 Ri 
和 Riow 所 控制 的 开关 连接 到 总 线 上 。 当 Rin 置 1 上 时， 总线 上 的 数据 装 入 到 Ri 中。 同样 ， 当 Riv 置 1 
上 H， 寄 存 器 Ri 的 内 容 被 放 公 总 线 上 。 当 Riww 等 于 0 时 ， 总 线 用 来 传送 其 他 寄存 器 的 数据 。 

假设 我 们 希望 将 寄存 器 R1 的 内 容 传送 到 R4 中 。 可 以 采用 如 下 方法 来 完成 : 

* 通过 将 R1ow 置 成 1 使 寄存 器 R1 可 以 输出 ， 这 样 可 以 将 R1 的 内 容 放 到 处 理 器 总 线 上 。 

* 通过 将 R46 置 为 1 使 寄存 器 R4 可 以 输入 ， 这 样 可 以 将 处 理 器 总 线 上 的 数据 装 和 人 到 寄存 器 

R4 中 。 

处 理 器 内 部 的 所 有 操作 和 数据 传送 都 在 由 处 理 器 时 钟 给 定 的 时 间 周 期 内 完成 。 在 时 钟 周期 
的 起 始 处 判断 传送 的 具体 控制 信号 ， 本 例 中 是 将 Ri MRA 置 为 1。 害 存 器 由 边沿 触发 器 构成 。 
因此 、 在 下 一 个 时 钟 的 活动 边沿 ， 构 成 R4 的 触发 器 装 和 人 输入 端的 数据 。 同 时 ， 控 制 信号 R1,, 和 
R4, 返回 0。 在 本 章 的 其 余部 分 我 们 将 使 用 这 种 定时 数据 传送 的 简单 模型 。 不 过 ， 应 该 指出 的 是 
使 用 其 他 方法 也 是 可 行 的 。 例 如 ， 数 据 传 送 可 以 使 用 时 钟 的 上 升 沿 和 下 降 沿 。 而 且 ，、 当 不 用 边 
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沿 触发 器 时 可 能 需要 两 个 或 更 多 的 时 钟 信号 来 确保 正确 的 数据 传送 。 这 种 方法 称 为 多 相 时 钟 。 

对 于 寄存 器 Ri 中 的 一 位 实现 如 图 7-3 所 示 。 一 个 两 输入 端的 多 路 复 用 器 用 来 选择 边沿 DD 触 发 
器 的 输入 端 数据 。 当 控制 输入 Ri 等 于 1 时 ， 多 路 复 用 器 选择 总 线 上 的 数据 ， 读 数据 在 时 钟 的 上 
升 治 被 装 入 到 触发 器 中 。 当 Ri 等 于 0 时 ， 多 路 复 用 器 反馈 当前 保存 在 触发 器 中 的 值 。 

触发 器 Q 输 出 端 经 由 三 态 门 与 总 线 相 连 。 当 Ri 等 于 0 时 ， 三 态 门 的 输出 端 呈 高 阻 态 (电路 
断 开 )， 这 与 开关 的 开路 状态 一 致 。 当 Riow= 1 时 ， 三 态 门 根据 Q 值 来 驱动 总 线 为 0 或 为 1。 


7.1.2 执行 算术 或 逻辑 操作 


ALU 是 不 含 内 部 存储 器 的 组 合 电 路 。 它 完成 对 A 和 B 输 入 端的 两 个 操作 数 的 算术 和 逻辑 运算 。 
在 图 7-1 和 图 7-2 中 ， 一 个 操作 数 是 多 路 复 用 器 MUX 的 输出 ， 另 一 个 操作 数 直 接 从 总 线 上 获得 。 
ALU 产 生 的 结果 临时 存储 在 寄存 器 Z 中 。 因 此 ， 将 寄存 器 R1 的 内 容 与 R2 的 内 容 相 加 后 结果 存在 
寄存 器 R3 中 的 操作 序列 是 : 

1. Rlou, Yin 内 部 处 理 器 总 线 

2.R2,, , SelectY, Add, Zin 

3. Lom , R3;, 

某 一 步 中 命名 的 信号 在 其 相应 那 一 步 的 
时 钟 周期 内 是 处 于 激活 状态 的 ， 而 所 有 其 他 
言 号 是 不 被 激活 的 。 因 此 ， 第 1 步 ， 人 允许 寄存 
器 R1 输 出 以 及 寄存 器 Y 输 入 ， 使 R1 的 内 容 由 
总 线 传送 到 Y。 在 第 2 步 ， 多 路 复 用 器 的 选择 
信号 设置 为 SelectY， 使 多 路 复 用 器 控制 寄存 
器 Y 的 内 容 传送 到 ALU 的 A 输入 端 上 。 同 时 ， 
寄存 器 R2 的 内 容 传送 到 总 线 ， 然 后 再 输入 到 B 
输入 端 上 。ALU 实 现 的 功能 取决 于 该 部 件 的 
控制 线 上 使 用 的 信号 。 在 这 种 情况 下 ，Add 线 
被 置 成 1, 将 ALU 的 A、B 两 个 输入 端的 数 相 加 ， 
并 输出 相 加 的 和 。 由 于 它 的 输入 控制 信号 是 
激活 状态 ， 所 以 将 这 个 相 加 的 和 装 和 人 到 寄存 
器 Z 中 。 第 3 步 ， 将 寄存 器 Z 的 内 容 传送 到 目标 
寄存 器 R3 中 。 由 于 在 每 个 时 钟 周期 中 间 ， 只 
有 一 个 寄存 器 输出 连接 到 总 线 上 ， 所 以 最 后 
一 步 的 传送 不 能 在 第 2 步 中 完成 。 

在 这 里 的 介绍 性 讨论 中 ,我 们 假设 要 执行 
的 每 一 功能 都 有 一 个 专用 人 信号。 例如， 假设 有 
独立 的 控制 信号 来 表示 单个 ALU 操 作 , 如 Add、 
Subtract、XOR 等 。 在 实际 的 应 用 中 ， 采 用 一 
定位 数 的 编码 来 表示 。 例 如 ， 如 果 ALU 可 实 
现 八 种 不 同 操作 ， 那 么 需要 使 用 三 种 控制 信 
号 就 足以 表示 所 需要 的 操作 。 在 7.5.1 节 我 们 图 7-2 图 7-1 中 寄存 器 的 输入 和 输出 控制 
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将 讨论 控制 信号 编码 的 限制 以 及 利弊 。 





图 7-3 寄存 器 中 一 位 的 输入 和 输出 控制 


7.1.3 从 存储 器 中 取出 一 个 字 


为 了 从 存储 器 中 取出 一 个 字 长 的 信息 ， 处 理 器 必须 指明 存放 该 信息 的 存储 器 地 址 并 请 求 读 
操作 。 无 论 要 取 的 信息 表示 程序 指令 还 是 由 指令 指明 的 操作 数 要 求 这 样 做 。 处 理 器 将 所 请 求 的 
地 址 传送 到 MAR，、MAR 输 出 连接 到 存储 器 总 线 的 地 址 线 上 。 同时 ， 处 理 器 使 用 存储 器 总 线 的 控 
制 线 指明 需要 的 读 操 作 。 当 从 存储 器 中 接收 到 所 需要 的 数据 时 ， 便 将 该 数据 保存 到 寄存 器 MDR 
中 ， 还 可 以 将 MDR 寄 存 器 中 保存 的 这 些 数 据 传送 到 处 理 器 的 其 他 寄存 器 中 。 

寄存 器 MDR 的 连接 如 图 7-4 所 示 。MDR 有 四 个 控制 信号 : MDR 和 MDRow 控制 与 内 部 总 线 
的 连接 ，MDRmz 和 MDRo 控制 与 外 部 总 线 的 连接 。 对 图 7-3 中 的 电路 稍 做 修改 便 可 以 提供 额外 
的 连接 。 可 用 三 输入 多 路 复 用 器 将 存储 器 总 线 的 数据 线 连 接 到 第 三 个 输入 端 上 。 当 MDRnz = 1 时 
选择 该 输入 端 ， 由 MDRwe 控 制 的 一 个 三 态 门 用 来 连接 触发 器 的 输出 端 和 存储 器 总 线 。 


存储 器 总 线 内 部 处 理 器 
数据 线 MDR,, MBR, 总 线 





DR : MDR 


.图 7-4 寄存 器 MDR 的 连接 及 控制 信号 


在 进行 存储 器 读 和 写 操 作 期 间 ， 内 部 处 理 器 操作 的 时 序 必须 与 存储 器 总 线 上 寻 址 设备 的 响 
应 保持 一 致 。 处 理 器 在 一 个 时 钟 周期 内 完成 一 个 内 部 数据 传送 ， 而 寻 址 设备 的 操作 速度 随 设备 
的 不 同 而 有 所 差异 。 我 们 在 第 5 章 中 看 到 现代 处 理 器 在 处 理 器 的 同一 个 芯片 中 包括 一 个 片上 的 高 
速 缓存 (cache)。 通 常 ， 高 速 缓存 在 一 个 时 钟 周 期 中 响应 一 次 存储 器 的 读 请 求 。 然 而 ， 当 发 生 
高 速 缓存 未 命中 情况 时 ， 读 请 求 传送 到 主 存储 器 上 ， 这 将 会 导致 有 多 个 时 钟 周期 的 延迟 。 读 / 写 
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请 求 还 可 以 使 用 预定 义 的 存储 器 映射 WO 设备 中 的 寄存 器 。 此 类 W/O 寄存器 没有 高 速 缓存 ， 所 以 访 
问 这 些 寄存 器 总 是 需要 花费 大 量 时 钟 周 期 的 。 

为 了 适应 响应 时 间 的 不 同 ， 处 理 器 将 一 直 等 待 ， 直 到 它 接收 到 所 请 求 的 读 操作 已 经 完成 的 
提示 为 止 。 为 了 达到 这 个 目的 ,我 们 将 假设 使 用 一 个 叫做 存储 器 功能 完成 《MFC) 的 控制 信号 。 
寻 址 设备 将 这 个 信号 设置 为 1 来 表示 指定 单元 的 内 容 已 经 读 出 并 且 已 经 放 到 了 存储 器 总 线 的 数据 
线 上 。( 结 合 第 4 章 对 总 线 的 讨论 ， 我 们 已 经 过 到 过 此 类 信号 的 多 个 例子 ， 例 如 图 4-25 的 从 动 就 
绪 以 及 图 4-41 中 的 TRDY#,) 

看 一 个 读 操作 的 例子 ， 考 虑 指令 Move (R1)，R2。 执 行 这 条 指令 所 需要 的 动作 是 : 

1. MAR - [RI] 

2. 在 存储 器 总 线 上 开始 一 个 读 操作 

3. 等 待 存储 器 的 MFC 响 应 

4. 从 存储 器 总 线装 入 MDR 

5.R2—[MDR] 

这 些 动作 可 以 作为 独立 的 步 又 来 执行 ， 但 有 些 也 可 以 合并 成 一 步 来 完成 。 每 个 动作 可 以 在 
一 个 时 钟 周期 中 完成 ， 只 有 动作 3 需要 一 个 或 更 多 时 钟 周 期 ， 这 要 取决 于 寻 址 设备 的 速度 。 

为 了 简单 起 见 ， 我 们 假设 MAR 的 输出 一 直 处 于 使 能 状态 ， 困 此 MAR 的 内 容 总 是 可 以 在 存储 
器 总 线 的 地 址 线 上 获得 。 这 种 情况 是 处 理 器 作为 总 线 控制 器 的 情况 。 当 一 个 新 地 址 装 入 到 MAR 
时 ， 就 在 下 一 时 钟 周 期 的 开始 时 出 现在 存 铺 器 总 线 上 ， 如 图 7-5 所 示 。 在 地 址 装 入 MAR 的 同时 激 
活 了 读 榨 制 的 信号 ， 该 信号 使 总 线 接口 电路 向 总 线 上 发 出 读 请 求 MR。 使 用 这 种 安排 ， 我 们 可 以 
将 上 面 的 动作 1 和 2 合并 成 一 个 控制 步 又 。 当 等 待 存储 器 响应 时 ， 通 过 激活 控制 信号 MDRue 将 动 
作 3 和 4 也 组 合 在 一 起 .因而 ， 从 存储 器 收 到 的 数据 在 MFC 信 号 收 到 的 那个 时 钟 周期 的 末尾 装 入 
MDR 中 。 在 下 一 时 名 同期， 激活 MDRo 将 数据 传送 到 寄存 器 R2 中 。 这 意味 着 存 入 器 读 操 作 需 要 
三 步 ， 使 用 被 激活 的 信号 来 糖 述 如 下 : 

1. Ri, MAR;,, Read 

2. MDRne, WMEC 

3. MDRJj,,, R2;, 

其 中 WMFC 是 处 理 器 的 控制 电路 等 待 MFC 信 号 到 来 的 控制 信号 

图 7.5 表 明 。 就 在 读 命令 的 同一 个 周期 MR 内 MDRue 被 置 成 1。 因 此 ， 在 后 续 的 讨论 中 ， 我 们 
并 不 明确 指定 MDRuz 的 值 ， 并 认为 它 总 是 等 于 MR 的 。 、 


7.1.4 向 存储 器 中 存储 一 个 字 


向 存储 器 中 存储 入 一 个 字 遵从 类 似 的 过 程 : 将 目标 地 址 装 到 MAR 中 ， 接 着 将 要 写 入 的 数据 
装 人 到 MDR 中 并 发 出 写 请 求 。 因 此 ， 执 行 指令 Move R2, (R1) 时 的 顺序 如 下 : 

1.Riw，MARw 

2. R2,,, MDR;,, Write 

3. MDRous, WMFC 

和 读 操 作 一 样 ， 写 控制 信号 使 存储 器 总 线 接口 硬件 向 存储 器 总 线 发 送 写 请 求 。 处 理 器 停留 
在 第 3 步 ， 直到 存储 器 操作 完成 并 收 到 MFC 响 应 为 止 。 
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图 7-5 存储 器 读 操 作 的 时 序 


7.2 一 条 完整 指令 的 执行 
现在 让 我 们 把 执行 一 条 指令 所 要 求 的 一 系列 基本 操作 结合 在 一 起 。 下 面 考虑 指令 
Add (R3), R1 : 
”该 指令 将 R3 所 指向 的 存储 器 单元 的 内 容 与 寄存 器 R1 的 内 容 相 加 。 执 行 该 指令 需要 如 下 动作 : 

L 取 指令 

2. 取 第 一 个 操作 数 (R3 所 指向 的 存储 器 单元 中 的 内 容 ) 

3. 执行 加 法 操作 

4. 结果 存 人 R1 | 

图 7-6 给 出 了 在 图 7-1 的 单 总 线 体系 结构 中 ， 实 现 这 些 操作 所 需要 的 一 系列 控制 步 又。 指令 执 
行 过 程 如 下 。 在 第 1 步 中 ， 通 过 将 PC 内 容 装 到 MAR 中 以 及 向 存储 器 发 送 读 请 求 ， 初 始 化 取 指令 
操作 。 选 择 信号 设置 为 Select4， 使 多 路 复 用 器 MUX 选 择 常量 4。 该 值 与 B 输 入 端的 操作 数 〈 即 PC 
的 内 容 ) 相 加 ， 结 果 保 存 到 寄存 器 Z 中 。 在 第 2 步 中 ， 当 等 待 的 存储 器 响应 时 ， 将 寄存 器 Z 中 更 新 
后 的 地 址 传送 回 PC 中 。 第 3 步 ， 将 从 存储 器 中 取出 的 字 装 人 到 巫 中 。 

第 1 步 到 第 3 步 构成 取 指令 阶段 ， 这 对 所 有 指令 都 是 相同 的 。 指 令 译 码 电路 在 第 4 步 的 开始 便 
解释 职 的 内 容 ， 这 样 可 以 使 控制 电路 激活 第 4 步 到 第 7 步 中 的 控制 信号 ， 第 4 步 到 第 7 步 构成 指令 的 
执行 阶段 。 在 第 4 步 中 ， 寄 存 器 R3 的 内 容 传送 到 MAR ， 并 开始 存储 器 读 操作 。 接 着 在 第 5 步 ，Rl 
的 内 容 传送 到 寄存 器 Y 中 ， 为 加 法 操作 做 准备 ， 当 读 操 作 完 成 时 ， 在 寄存 器 MDR 中 获得 存储 器 操 
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作 数 ， 在 第 6 步 执行 加 法 操作 。MDR 的 内 容 送 到 总 线 上 ， 这 样 也 就 送 到 了 ALU 的 B 输 入 端 。 通 过 
选择 SelectY， 可 选择 寄存 器 Y 作 为 ALU 的 第 2 
个 输入 端 。 相 加 的 和 保存 到 寄存 器 Z 中 ， 之 后 


在 第 7 步 送 到 R1 中 。End 信 号 将 用 返回 到 第 1 步 PC ,, , MAR;, , Read, Select4, Add, Zin 
的 方式 开始 一 条 新 指令 的 读 取 周期 。 Zout PC in, Yin, WMFC 
在 这 个 讨论 中 阐述 了 图 7-6 除 了 第 2 步 中 MDR ou , IR, 
Ym 以 外 的 所 有 控制 信号 。 在 执行 加 法 指令 中 ， R36 , MAR in , Read 
不 需要 将 被 更 新 的 PC 内 容 复制 到 寄存 器 Y 中 。 Rlow, Yin, WMF C 
但 是 ， 在 转移 指令 中 ， 需 要 使 用 PC 的 更 新 值 MDR ww , SelectY Add, Zin 


来 计算 转移 的 目标 地 址 。 为 了 加 速 转移 指令 Zou , Riin , End 
的 执行 ， 在 第 2 步 中 将 该 值 复制 到 寄存 器 Y 中 。 
由 于 第 2 步 是 取 指令 阶段 的 一 部 分 ， 所 以 对 于 图 7-6 执行 Add (R3), R1 指令 的 控制 序列 
所 有 指令 会 执行 相同 的 动作 。 由 于 寄存 器 Y 并 不 用 于 其 他 目的 ， 所 以 并 不 会 带 来 任何 影响 。 


转移 指令 


转移 指令 用 转移 目标 地 址 代替 PC 中 的 内 容 ， 该 地 址 一 般 通 过 将 PC 的 值 与 转移 指令 给 出 的 偏 
移 量 X 相 加 而 获得 被 更 新 的 值 。 图 7-7 给 出 了 实现 一 个 无 条 件 转移 指令 的 控制 序列 。 通 常 从 取 指 
令 阶段 开始 处 理 ， 到 第 3 步 指令 装 和 IR 时 ， 取 
指令 阶段 结束 。 指 令 译 码 电 路 从 IR 中 分 离 出 








偏 移 量 ， 如 果 需 要 ， 指 令 译 码 电路 要 进行 符 PC ,MAR in, Read, Select4, Add, Zin 
号 扩展 。 由 于 PC 的 更 新 值 已 存 人 寄存 器 Y 中 ， Zout » PCin, Yin, WMF C 
所 以 在 第 4 步 将 偏 移 量 X 送 到 总 线 上 ， 并 且 进 MDR ou , IRn 
行 加 法 操作 。 在 第 5 步 将 操作 的 结果 转移 目标 Offset-field-of-IR „u , Add, Zin 
地 址 装 入 PC 中 。 Zout » PCi,, End 
转移 指令 用 到 的 偏 移 量 X， 通 常 是 转移 目 
标 地 址 和 直接 跟 在 转移 指令 后 的 指令 的 地 址 图 777 一 条 无 条 件 转移 指令 的 控制 序列 


之 差 。 例 如 ， 如 果 转 移 指令 在 地 址 为 2000 的 单元 中 ， 转 移 目 标 地 址 是 2050， 那 么 X 值 一 定 是 46。 
这 个 推断 可 以 立即 从 图 7-7 的 控制 序列 中 看 出 来 。 在 取 指 令 阶 段 ， 在 知道 所 执行 指令 的 类 型 之 前 ， 
PC 被 增值 。 因 此 ， 当 在 第 4 步 计算 转移 地 址 时 ， 使 用 的 PC 值 是 更 新 后 的 值 ， 它 指向 的 是 存储 器 
中 转移 指令 之 后 的 那 条 指令 。 

现在 考虑 条 件 转移 指令 。 在 这 种 情况 下 ， 我 们 需要 在 PC 装 入 新 值 之 前 检查 条 件 码 的 状态 。 
例如 ， 对 于 一 个 负数 转移 (Branch<0) 指令 ， 图 7-7 的 第 4 步 用 下 式 来 替换 : 

Offset-field-of-IR.,,, Add, Z, If N = 0 then End 

因此 ， 如 果 N = 0， 处 理 器 在 第 4 步 后 返回 到 第 1 步 。 如 果 N=1， 执 行 第 5 步 将 新 值 装 和 人 到 PC 中 ， 
从 而 实现 转移 操作 。 


7.3 多 总 线 结构 


我 们 使 用 图 7-1 中 简单 的 单 总 线 结构 来 说 明基 本 思想 。 由 于 在 一 个 时 钟 周期 内 ， 只 能 有 一 个 
数据 项 在 总 线 上 传输 ， 所 以 图 7-6 和 图 7-7 中 的 最 终 控 制 序列 很 长 。 为 了 减少 所 需要 的 步骤 ， 大 多 
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数 商 业 处 理 器 提供 允许 多 个 传输 并 行 执行 的 多 个 内 部 通路 。 
图 7-8 描 述 了 用 于 连接 处 理 器 寄存 器 和 ALU 的 三 总 线 结构 。 所 有 通用 寄存 器 组 合成 一 个 独立 的 


块 ， 称 为 寄存 器 文件 。 在 VLSI 工艺 中 ， 实 现 
大 量 寄存 器 的 最 有 效 方法 是 存储 单元 阵列 的 形 
式 ， 类 似 于 第 5 章 所 描述 的 用 于 实现 随机 访问 
存储 器 (RAM) 的 那些 方法 。 上 面 所 说 的 图 7- 
8 中 的 寄存 器 文件 具有 3 个 端口 。 其 中 两 个 是 输 
出 端口 , 允许 同时 访问 两 个 不 同 寄 存 器 的 内 容 ， 
并 把 寄存 器 内 容 放 在 总 线 A 和 总 线 B 上 ; 第 三 
个 端口 允许 总 线 C 上 的 数据 在 同一 时 钟 周期 内 
装 人 到 第 三 个 寄存 器 中 。 

总 线 A 和 总 线 B 用 于 将 源 操作 数 传送 到 
ALU 的 A 输入 端 和 B 输 入 端 上 ， 在 ALU 中 可 实 
现 算术 或 逻辑 运算 ， 通 过 总 线 C 将 结果 传送 到 
目的 地 。 如 果 需 要 ，ALU 可 以 将 两 个 输入 操 
作 数 中 的 一 个 不 加 修改 地 传送 给 总 线 C。 我 们 
为 此 类 操作 (R=A 或 R=B ) 调用 ALU 控 制 信号 
三 总 线 结 构 可 以 省 略图 7-1 中 的 寄存 器 Y 和 Z。 

图 7-8 的 第 二 个 特征 是 引入 了 递增 部 件 ， 
它 用 于 对 PC 每 次 加 4。 使 用 递增 部 件 省 略 了 如 
图 7-6 和 图 7-7 中 需要 使 用 主 ALU 完 成 PC 加 4 的 
方法 。 在 ALU 输 入 端的 多 路 复 用 器 的 常量 4 的 
源 还 是 有 用 的 ， 它 可 用 于 递增 其 他 的 地 址 ， 
例如 在 LoadMultiple 和 StoreMnultiple 指 令 中 的 
存储 器 地 址 。 

考虑 三 操作 数 指令 

Add R4, R5, R6 


在 图 7-9 中 给 出 了 执行 该 指令 的 控制 序列 。 第 
1 步 ， 利 用 R=B 的 控制 信号 将 PC 的 内 容 经 过 
ALU 装 人 到 MAR 中 以 启动 存储 器 的 读 操 作 。 
同时 PC 递增 4。 注 意 装 人 到 MAR 的 什 是 PC 中 
原来 的 值 。 加 载 到 PC 中 的 增 量 值 是 在 时 钟 周 
期 末 完 成 的 ， 所 以 不 会 影响 MAR 的 内 容 。 第 2 
步 ， 处 理 器 等 待 MFC 并 把 收 到 的 数据 装 入 
MDR 中 ， 接 着 在 第 3 步 把 这 些 数据 送 到 IR。 最 
后 ， 指 令 的 执行 阶段 只 需 控制 步 中 的 一 个 第 4 
步 便 可 以 完成 。 

通过 为 数据 传输 提供 更 多 的 通路 ， 大 大 
减少 了 指令 执行 时 所 需要 的 时 钟 周 期 数量 。 
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图 7-8 数据 通路 的 三 总 线 结构 


PC ou , R=B, MAR;,, Read, IncPC 


WMFC 
MDR oue , R=B, Rin 
R4oua , R5 ous 9 SelectA， Add, Róin, End 


299 


总 线 C 
4 
Í| 
ii 
Í 
= 
ml 
_ 
I 
[ 
Í 
pa 
a É 
424 





R5，R6 的 控制 序列 





300 P7 Ë 


7.4 硬件 控制 


处 理 器 为 了 执行 指令 ， 必 须 具 备 一 些 可 以 按 正 确 顺序 产生 所 需 控 制 信号 的 方法 。 计 算 机 设 
计 者 使 用 大 量 技术 来 解决 这 类 问题 。 基 本 上 有 两 种 方法 : 硬件 控制 和 微 程序 控制 。 下 面 我 们 对 
每 一 种 技术 进行 详细 的 讨论 ， 本 节 首 先 讨论 
硬件 控制 。 

考虑 图 7-6 给 出 的 控制 信号 序列 。 该 序列 
中 的 每 一 步 在 一 个 时 钟 周期 内 完成 。 可 以 使 用 
一 个 计数 器 来 跟踪 控制 步 ， 如 图 7-10 所 示 。 计 
数 器 中 的 每 一 个 状态 或 每 个 计数 对 应 着 一 个 控 
制 步 。 所 需要 的 控制 信号 由 下 列 信息 决定 : 

.控制 步 计数 器 的 内 容 

. 指令 寄存 器 的 内 容 

条件 码 标志 的 内 容 一 

* 外 部 输入 信号 ， 比 如 MFC 和 中 断 请 求 | 

为 了 进一步 了 解 控 制 器 的 组 成 ， 我 们 首 aeea 
先 看 一 下 相关 的 硬件 简化 图 。 图 7-10 中 的 译 码 sT 
器 /编码 器 块 是 根据 所 有 输入 状态 产生 所 需要 ATO 控制 器 的 组 成 
的 控制 输出 的 组 合 电路 。 通 过 将 译 码 和 编码 功能 分 离 ， 我 们 得 到 了 更 具体 的 框图 7-11。 步 译 码 
器 按 控制 顺序 为 每 一 步 或 每 个 时 间 片 提供 独立 的 信号 线 。 类 似 地 ， 指 令 译 码 器 的 输出 是 由 每 条 
机 器 指令 对 应 一 条 单独 输出 线 构成 的 。 对 于 装 入 还 中 的 任何 一 条 指令 ， 输 出 线 INS1 到 INS 中 只 
能 有 一 条 线 设置 成 1， 其 他 输出 线 全 部 设置 成 0 ( 译 码 器 的 设计 细节 参看 附录 A)。 图 7-11 中 编码 
器 块 将 输入 信号 组 合并 产生 单独 的 Yw、PCw、Add、End 等 控制 信号 。 对 于 图 7-1 中 的 处 理 器 结 
构 ， 我 们 在 图 7-12 中 给 出 一 个 如 何 采用 编码 器 来 产生 Zu 控制 信号 的 实例 。 该 电路 实现 逻辑 函数 

Z= T,+ Ts ` ADD + T, - BR + (1-1) 


对 于 所 有 指令 ， 该 信号 在 时 间 段 Ti 产生 ， 对 于 ADD 指 令 在 Te 产生， 对 于 无 条 件 转 移 指令 在 T, 产 
生 ， 等 等 。Z 的 逻辑 函数 从 图 7-6 和 图 7-7 中 的 控制 序列 中 获得 。 我 们 再 看 一 个 例子 ， 图 7-13 给 
由 逻辑 函数 





End=T;.: ADD +T; : BR+(Ts- N+T., : N). BRN+. (7-2) 
产生 End 控 制 信号 的 电路 。End 信 号 通过 将 控制 步 计数 器 的 值 重新 设置 成 它 的 初始 值 来 启动 新 的 
取 指 令 周 期 。 在 图 7-11 中 包含 另 一 称 作 RUN 的 控制 信号 ， 当 RUN 等 于 1 时 ， 使 计数 器 在 每 个 时 钟 
周期 的 结尾 增 1。 当 RUN 等 于 0 时 ， 计 数 器 停止 计数 。 每 当 要 发 送 WMFC 信 号 时 ， 处 理 器 都 要 等 
待 来 自 存 储 器 的 响应 。 
图 7-10 或 图 7-11 所 示 的 控制 硬件 可 被 看 作 是 一 个 状态 机 ， 它 根据 指令 寄存 器 中 的 内 容 、 条 件 
码 和 外 部 输入 ， 在 每 个 时 钟 周期 内 ， 从 一 种 状态 变换 到 另 一 种 状态 。 状 态 机 的 输出 是 控制 信号 。 
该 状态 机 所 执行 的 操作 序列 是 由 逻辑 单元 的 线路 所 决定 的 ， 因 而 称 为 “硬件 ”"。 采 用 这 种 方法 的 
控制 器 能 够 以 很 高 的 速度 进行 操作 。 但 是 ， 这 种 方法 的 灵活 性 较 差 ， 可 实现 指令 集 的 复杂 度 也 
是 有 限 的 。 
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控制 信号 
图 7-11 分 离 的 译 码 和 编码 功能 


Branch Add Branch<0 





之 End 


图 7-12 图 7-1 处 理 器 Zi 控制 信号 的 产生 图 7-13 End 控 制 信号 的 产生 


一 个 完整 的 处 理 器 


可 以 用 图 7-14 所 示 的 结构 来 设计 一 个 完整 的 处 理 器 。 此 结构 包含 有 一 个 指令 部 件 ， 该 部 件 
可 以 从 指令 高 速 缓存 中 读 取 指 令 ， 而 当 所 需 的 指令 不 ` 在 缓存 中 时 可 以 立即 从 主 存 中 读 取 指 令 。 
在 该 处 理 器 中 具有 单独 的 部 件 分 别处 理 整数 和 浮 点 数 。 其 中 ， 每 个 部 件 都 可 以 组 织 成 图 7-8 所 示 
的 结构 。 在 这 些 部 件 与 主 存 之 间 插 入 了 一 个 数据 高 速 缓 存 。 目前 有 许多 处 理 器 采用 分 离 的 指令 
和 数据 高 速 缓存 。 不 过 也 有 使 用 一 个 缓存 来 存储 指令 和 数据 的 处 理 器 。 处 理 器 是 与 系统 总 线 相 
连 的 ， 因 而 计算 机 中 的 其 他 部 件 通 过 总 线 接口 与 处 理 器 相连 。 

尽管 在 图 7-14 中 只 画 出 了 一 个 整数 部 件 和 一 个 浮 点 部 件 ， 为 了 提高 机 器 的 并 行 处 理 能 力 ， 
通常 在 处 理 器 中 会 包含 有 多 个 不 同类 型 的 部 件 。 使 用 多 个 部 件 来 提高 指令 执行 速度 的 方法 ; 我 
们 将 在 第 8 章 中 讨论 。 
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图 7-14 一 个 完整 的 处 理 器 框图 


7.5 微 程序 控制 


在 7.4 节 中 ， 我们 看 到 处 理 器 内 部 所 需要 的 控制 信号 是 如 何 使 用 控制 步 计 数 器 和 译 码 器 /编码 
器 电路 产生 的 。 现 在 讨论 另 一 种 称 为 微 程序 控制 的 技术 ， 这 里 控制 信号 由 类 似 于 机 器 语言 的 程 
429] FERFE. 
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图 7-15 用 于 图 7-6 的 微 指 令 实例 


首先 介绍 一 些 常 用 术语 。 控 制 字 (CW) 是 一 个 字 ， 它 的 每 一 位 代表 图 7-11 中 的 不 同 控制 信 
号 。 指 令 控制 序列 中 的 每 一 步 控制 在 CwW 中 采用 1 或 0 的 方式 来 定义 。 对 于 图 7-6 中 的 7 个 步骤 所 对 
应 的 CW 情 况 如 图 7-15 所 示 。 我 们 假设 SelectY 由 Select=0 表 示 ，Select4 由 Select=1 表 示 。 由 机 器 
指令 的 控制 序列 所 对 应 的 一 系列 CW 构 成 该 指令 的 向 程序 ， 在 该 微 程 序 中 的 单个 控制 字 称 作为 
微 指 令 。 





0 


一 台 计 算 机 指令 集中 的 所 有 指令 微 程序 存储 在 一 个 特定 的 存储 器 中 ， 该 存储 器 称 为 控制 存 
储 器 。 控 制 部 件 通 过 从 控制 存储 器 中 连续 读 取 相应 微 程序 的 CW， 可 以 为 任何 一 个 指令 产生 控制 
信号 。 图 7-16 中 给 出 了 一 个 控制 部 件 组 织 结构 的 建议 形式 。 为 了 从 控制 存储 器 中 连续 地 读 取 控 
制 字 ， 这 里 引用 了 一 个 微 程序 计数 器 (hjPC)。 每 当 有 新 的 指令 装 入 到 IR 中 时 ， 被 称 为 “启动 地 
址 产生 器 ”的 模块 的 输出 便装 人 到 APC 中 。 之 后 APC 便 随时 钟 自动 增加 ， 这 样 就 可 以 从 控制 存储 
器 中 连续 地 读 出 微 指令 。 因 此 ， 控 制 信号 就 可 以 按照 正确 的 顺序 传送 到 处 理 器 的 各 个 部 分 中 。 

图 7-16 中 使 用 的 简单 结构 无 法 实现 控制 部 件 的 一 个 重要 功能 ， 即 当 需 要 控制 器 需要 检查 条 
件 码 的 状态 ， 或 对 外 部 输入 进行 检查 以 便 从 两 个 动作 过 程 一 三 一 
中 选择 一 个 执行 的 功能 无 法 形成 。 在 硬件 控制 情况 下 ， 这 

R Ë 启动 地 址 
产生 器 


种 功能 可 以 通过 在 编码 器 电路 中 增加 一 个 适当 的 形 如 7-2 等 

选 的 方法 是 使 用 条 件 转移 微 指令 。 这 些微 指令 除了 指定 转 “一 

移 地 址 外 ， 还 将 指明 外 部 输入 、 条 件 码 或 指令 寄存 器 中 的 _ 
[De 






式 所 示 的 逻辑 函数 来 完成 。 在 微 程序 控制 情形 下 ， 一 种 可 
位 ， 这 些 内 容 是 产生 转移 的 条 件 。 

现在 ， 指 令 Branch<0 可 以 用 图 7-17 所 示 那 种 微 程 序 来 
实现 了 。 将 该 指令 读 取 到 TR 之 后 ， 转 移 微 指令 将 控制 权 转 
给 相应 的 微 程序 ， 我 们 假定 在 控制 存储 器 的 单元 25 处 开始 。 
那么 ， 这 个 地 址 就 是 图 7-16 中 的 启动 地 址 产生 器 模块 的 输 
出 。 在 单元 25 处 的 微 指令 将 测试 条 件 码 的 第 N 位 ， 如 果 该 ETS 微 程序 控制 部 件 的 基本 构成 


位 等 于 0， 就 转移 到 单元 0 处 取 新 的 机 器 指令 ; 否则 ， 执 行 在 单元 26 处 的 微 指 令 ， 将 转移 目标 地 
址 放 人 寄存 器 Z 中 ， 如 同 图 7-7 中 的 第 4 步 。 在 单元 27 处 的 微 指 令 将 该 地 址 送 到 PC 中 。 





PC ou , MAR in , Read, Select4, Add, Z;, 
Zou , PC ix , Yin, WMFC 
MDR out » IR;, 


Branch to starting address of appropriate microroutine 


If N=0, then branch to microinstruction 0 
Offset-field-of-IR ,,, , SelectY, Add, Z;, 
Zout , PC in , End 





图 7-17 指令 Branch<0 的 微 程序 


为 了 支持 微 程序 的 转移 ， 将 控制 器 的 结构 修改 成 如 图 7-18 所 示 的 情形 。 图 7-16 中 的 起 始 地 址 
生成 器 变 成 了 启动 和 转移 地 址 产生 器 。 该 模块 在 微 指 令 的 驱动 下 ， 将 新 地 址 读 入 到 HPC 中 。 为 
了 能 够 实现 条 件 转移 ， 将 外 部 输入 、 条 件 码 以 及 指令 寄存 器 的 内 容 作为 该 模块 的 输入 。 在 这 种 
控制 器 中 ， 每 当 从 微 程序 存储 器 中 取出 一 条 新 的 微 指令 时 PC 就 会 递增 。 不 过 以 下 的 几 种 情况 
例外 : 

1. 当 新 指令 取 入 下 时 ，HPC 中 装 入 了 这 条 指令 的 微 程序 首 地 址 。 
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2. 当 遇 到 转移 微 指令 且 转 移 条 件 满足 时 ，uPC 被 装 和 人 了 转移 地 址 。 
3. 当 遇 到 End 微 指令 时 ，kPC 被 装 入 了 取 指 令 周 期 的 微 程序 中 的 第 一 个 CW 的 地 址 (在 图 7-17 
中 该 地 址 是 0)。 
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图 7-18 允许 在 微 程序 中 条 件 转移 的 控制 部 件 的 结构 


7.5.1 微 指令 


在 前 面 我 们 对 串 行 微 指 令 技 术 进 行 了 描述 ， 现 在 进一步 了 解 单条 微 指令 的 格式 。 构 造 微 指 
令 的 直接 方法 是 为 每 个 控制 信号 分 配 一 位 的 位 置 ， 如 图 7-15 所 示 。 然 而 ， 这 种 方法 有 一 个 严重 
的 缺陷 一 一 由 于 所 需 信号 量 通常 很 大 ， 所 以 给 每 个 控制 信号 分 配 一 位 会 使 微 指令 变 得 很 长 。 而 
E. 在 任何 指定 的 微 指令 中 ， 只 有 很 少儿 位 被 设置 成 1 (用 于 主动 控制 )， 这 意味 着 可 用 的 位 空 
间 是 非常 有 限 的 。 再 考虑 图 7-1 的 简单 处 理 器 ,假设 它 只 包含 四 个 通用 寄存 器 RO、R1、R2 和 R3。 
在 该 处 理 器 中 有 些 连 接 是 始终 被 允许 的 ， 例 如 下 到 译 码 电路 的 输出 以 及 ALU 的 两 个 输入 都 是 此 
种 情形 。 其 余 到 各 个 寄存 器 的 连接 总 共 需 要 20 个 控制 信号 。 其 他 所 需 的 控制 信号 在 图 中 没有 给 
出 ， 其 中 包括 读 、 写 、 选 择 、WMFC 和 结束 信号 。 最 后 必须 说 明 ALU 所 能 实现 的 功能 。 假 设 提 
供 16 种 功能 ， 包 括 加 、 减 、 与 和 异 或 。 这 些 功能 取决 于 所 使 用 的 特定 ALU， 而 不 必 与 机 器 指令 
操作 码 一 一 对 应 。 所 以 ， 这 里 总 共 需 要 各 个 控制 信号 。 

如 果 采 用 前 面 描述 的 简单 编码 技术 ， 那 么 每 条 微 指 令 需要 42 位 。 幸 运 的 是 ， 微 指令 的 长 度 
可 以 很 容易 地 进行 压缩 。 其 中 ， 大 多 数 信号 并 不 是 同步 的 ， 并 且 还 有 许多 信号 之 间 是 互相 排斥 
的 。 例 如 ， 一 次 只 能 激活 ALU 的 一 种 功能 。 传 输 的 数据 源 必 须 是 惟一 的 ， 因 为 同时 不 可 以 将 两 
个 不 同 寄存 器 的 内 容 传 送 到 总 线 上 。 另 外 ， 存 储 器 的 读 和 写 信号 不 能 同时 被 激活 。 这 就 表示 可 
以 将 信号 分 组 ， 以 便 所 有 的 互 斥 信 号 归于 同一 组 中 。 因 此 ， 在 任何 一 条 微 指令 中 ， 每 组 中 至 多 
只 能 指定 一 条 微 操作 。 于 是 ， 可 以 采用 二 进 制 编码 技术 来 表示 同一 组 中 的 信号 。 例 如 ， 对 于 
ALU 中 的 16 种 功能 ， 用 四 位 就 足够 表示 了 。 寄 存 器 输出 控制 信号 PC。、MDR。w、Z,、Offsetww、 
R0,,. Rl. R2,a, R3,, 和 TEMPow 可 以 归 为 同一 组 。 共 中 的 任何 一 种 信号 可 以 用 惟一 的 4 位 代 
码 来 选 定 。 

对 于 其 余 信 号 可 以 作 进一步 的 自然 分 组 。 图 7-19 是 微 指令 中 部 分 格式 的 例子 ， 其 中 每 个 分 
组 所 占用 的 字段 要 足够 容 下 所 需要 的 代码 。 在 大 多 数字 段 中 ， 必 须要 包括 一 个 不 需要 这 一 动作 
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的 非 激活 代码 。 例 如 ，F1 中 的 爹 0 方式 表示 在 Fi 字段 中 可 表示 的 所 有 寄存 器 中 ， 没 有 一 个 寄存 器 
需要 将 其 内 容 放 到 总 线 上 。 并 不 是 在 所 有 字段 中 都 需 有 非 激活 代码 ， 例 如 ，F4 包 含 4 位 ， 表 示 
ALU 中 实现 的 16 种 操作 。 因 为 不 包括 空 代 码 ， 所 以 ALU 在 每 一 微 指 令 执 行 期 间 都 是 被 激活 的 。 
然而 ， 它 的 动作 要 通过 寄存 器 Z 受 到 机 器 其 余部 分 的 监控 。 只 有 激活 Zn 信号 时 ， 才 将 ALU 的 输 

出 装 入 到 寄存 器 Z 中 。 

将 控制 信号 按 字段 分 组 需要 一 些 硬件 ， 因 为 译 码 器 电路 必须 将 每 个 字段 中 的 位 方式 译 码 成 
单个 的 控制 信号 。 这 个 额外 硬件 的 开销 要 远 远 高 于 为 了 减少 控制 存储 对 每 条 微 指令 的 位 数 进行 
压缩 的 开销 。 在 图 7-19 中 ，42 个 信号 的 模式 只 需要 20 位 就 可 以 存储 。 

到 目前 为 止 ， 我 们 只 是 考虑 了 互 斥 控 制 信号 的 分 组 和 编码 。 可 以 将 这 种 思想 进行 扩展 ， 列 
举 出 所 有 可 能 的 微 指令 中 所 需 信号 的 模式 。 接 着 可 以 对 动作 控制 信号 中 的 每 一 个 有 意义 的 组 合 
分 配 一 个 不 同 的 代码 ， 用 来 表示 那 条 微 指令 。 这 种 完全 编码 方式 可 能 会 进一步 压缩 微 指 令 的 长 ”[8 引 
度 ， 不 过 同时 也 会 增加 所 需 译 码 器 电路 的 复杂 程度 。 








Fi (4 位 ) F2 (3 位 ) F3 (3 位 ) F4 (4 位 ) F5 (2 位 ) 
.0000: No transfer 000: No transfer 000: No transfer 0000: Add 00: No action 
0001: PC; 001: PC;, 001: MAKR;, 0001: Sub 01: Read 
0@D: MDR „u 010: IR;, 010: MDR;, : 10: Write 
0011: Zoue Oll: Zin 011: TEMP;, . 

0100: RO,, 100: RO 100: Yin 1111: XOR 

0101: Riow 101: Ria —— 

0110: R2 pur 110: R2; 16 种 ALU 

O111: R3 our 111: R36 功能 

1010: TEMP pur 

1011: Offset 


out 








F6(1 位 ) FTOR) F801) 


0: SelectY 0: No action 0: Continue 
1: Select4 1: WMFC 1: End 





图 7-19 字段 编码 微 指 令 部 分 格式 的 实例 


采用 压缩 代码 来 表示 每 条 微 指 令 中 的 少量 控制 功能 的 高 级 编码 方法 ， 称 为 纵向 结构 。 相 反 
的 是 图 7-15 的 最 少 化 编码 方案 ， 它 将 许多 资源 用 一 条 微 指 令 控制 ， 被 称 为 是 横向 结构 。 当 希望 
更 快 的 操作 速度 以 及 机 器 结构 允许 并 行使 用 资源 时 ， 横 向 方法 是 非常 有 效 的 。 由 于 纵向 方法 在 
实现 所 需 的 控制 功能 时 要 使 用 较 多 的 微 指令 ， 所 以 它 的 操作 速度 相对 来 说 要 慢 一 些 。 尽 管 每 条 
微 指令 需要 很 少 的 位 数 ， 但 并 不 表示 控制 存储 器 中 的 全 部 位 数 会 更 少 。 其 中 的 关键 因素 是 需要 
较 少 的 硬件 来 控制 微 指令 执行 。 
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在 微 程序 控制 中 ， 横 向 结构 和 纵向 结构 代表 了 两 种 极端 组 织 方 式 。 还 可 以 采用 许多 介 于 这 
两 者 之 间 的 方案 ， 其 中 编码 度 是 一 个 设计 参数 。 图 7-19 中 的 布局 是 横向 结构 ， 因 为 它 只 把 互 斥 
微 操作 分 在 同一 字段 中 。 结 果 它 丝毫 设 有 限制 处 理 器 并 行 实现 各 种 微 操作 的 能 力 。 

虽然 我 们 只 考虑 了 所 有 可 能 控制 信号 的 一 个 子 集 ， 不 过 这 个 子 集 可 以 代表 实际 的 要 求 。 这 
里 省 略 了 对 理解 操作 原理 没有 帮助 的 一 些 细节 。 


7.2.2 微 程 序 的 顺序 


在 图 7-15 中 的 简单 微 程序 实例 中 ， 除 了 在 取 指 令 阶段 最 后 的 转移 以 外 ， 只 需要 简单 顺序 执 
行 微 指 令 。 如 果 每 条 机 器 指令 都 是 由 这 种 微 程序 实现 的 ， 那 么 图 7-18 中 给 出 的 微 控 制 结构 就 足 
够 了 。 在 该 结构 中 /PC 控制 顺序 ， 通 过 将 机 器 指令 译 码 成 装 和 HPC 的 首 地 址 来 进入 微 程序 。 微 程 
序 内 的 一 些 转移 能 力 可 以 通过 指定 转移 地 址 的 专用 转移 微 指令 引入 ， 类 似 于 机 器 级 指令 进行 转 
移 的 方法 。 

有 了 这 种 方法 ， 编 写 微 程 序 就 相当 简单 了 ， 因 为 可 以 使 用 标准 的 软件 技术 。 然 而 ， 这 种 方 
法 有 两 个 主要 缺点 。 由 于 每 条 机 器 指令 都 有 独立 的 微 程序 ， 所 以 微 指令 的 数量 会 很 多 ， 并 且 会 
占用 大 量 的 控制 存储 器 。 如 果 大 部 分 机 器 指令 都 包含 多 种 寻 址 方式 ， 就 会 存在 许多 指令 与 寻 址 
方式 的 组 合 。 每 种 组 合 都 会 有 一 个 独立 的 微 程 序 ， 还 会 产生 相同 部 分 的 副本 。 我 们 希望 将 微 程 
序 组 织 成 尽 可 能 多 共享 相同 部 分 的 结构 。 这 要 求 有 许多 转移 微 指 令 在 各 个 部 分 之 间 传 送 控制 权 。 
因此 ， 产 生 了 第 二 1 

考虑 一 条 比较 复杂 的 完整 机 器 指令 的 例子 。 在 第 2 章 中 ， 我 们 使 用 了 此 类 指令 
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它 将 源 操作 数 与 寄存 器 Rdst 的 内 容 相 加 并 把 结果 存放 在 目标 寄存 器 Rdst 中 。 假 设 源 操作 数 可 用 下 
列 寻 址 方式 指定 : 寄存 器 、 自 动 递增 、 自 动 递减 和 变 址 寻 址 方式 ， 以 及 这 四 种 方式 的 间接 形式 ， 
我 们 现在 将 该 指令 与 图 7-1 中 的 处 理 器 结构 结合 来 说 明 微 程序 的 一 种 可 能 实现 方法 。 

为 了 易于 理解 ， 在 图 7-20 中 以 流程 图 形式 给 出 一 个 相应 的 微 程序 。 图 中 每 一 个 方 框 对 应 一 
个 控制 方 框图 中 所 指示 的 传送 和 操作 的 微 指令 。 微 指令 位 于 方 框图 右上 角 的 八进制 数 指定 的 地 
址 单元 中 。 每 个 八进制 数 代表 三 位 。 我 们 在 该 例 中 使 用 八进制 记 数 法 作为 二 进 制 数 的 简洁 标记 
法 。 图 中 的 大 部 分 流程 图 是 无 须 解释 的 ， 不 过 某 些 细节 还 需要 详细 说 明 。 我 们 将 首先 阐述 涉及 
的 问题 ， 接 着 具体 观察 图 中 的 微 指令 流 。 

使 用 按 位 -或 技术 修改 转移 地 址 

图 7-20 中 的 微 程序 说 明 在 一 个 转移 地 址 处 并 不 一 定 要 发 生 转移 。 这 是 通过 共享 公共 部 分 组 
合成 简单 微 程序 的 直接 效果 。 考 虑 图 中 标 为 a 的 点 ， 在 这 一 点 上 ， 必 须 通 过 直接 和 间接 寻 址 方 
式 来 选择 所 需要 的 动作 。 如 果 在 指令 中 指定 间接 方式 ， 那 么 就 执行 170 单 元 处 的 微 指 令 ， 从 存储 
器 中 取 操 作 数 。 如 果 指 定 为 直接 方式 ， 那 么 必须 绕 过 这 个 取 操 作 ， 而 直接 转移 到 171 单 元 处 。 绕 
过 170 单 元 处 微 指令 的 最 有 效 方法 是 让 前 一 一 条 转移 微 指 令 指向 地 址 170， 接 着 如 果 包 含 直接 寻 址 
方式 ， 用 一 个 或 门将 该 地 址 中 最 低位 改 成 1。 这 就 是 用 来 修 赤 转移 地 址 的 按 位 - 或 (bit-ORing) 
技术 。 

按 位 -或 的 一 种 替代 方法 是 在 单元 123、 143 和 166 处 使 用 两 个 条 件 转移 微 指令 。 另 一 种 可 能 
方式 是 在 转移 微 指令 中 包含 两 个 以 下 地 址 的 字段 ， 一 个 用 于 直接 寻 址 方式 ， 一 个 用 于 间接 寻 址 
方式 。 这 两 种 方法 都 不 如 按 位 -或 技术 。 
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MAR <- [PC]; Read; Z — [PC] + 4 






001 
PC, Y — [Z]; WMFC 






002 






IR — [MDR] 







003 


Branch{InstDec, OR} 






其 他 指令 的 微 程序 











变 址 寺 址 自动 递减 寻 址 自动 递增 寻 址 寡 存 器 间接 汁 址 
161 141 111 
Z- [PC] +4 Z — [Rsrc] + 4 


142 112 
PC—[ZJ;WMFC | | MAR, Rsrc — [Z]; Read Branch{ 171}; WMFC 
Y- 


162 
163 
164 143 
Z + [Y] + [Rsrc] Branch{ 170, OR}; WMFC 
165 
MAR — {Z}; Read 
166 


Branch{ 170, OR}; WMFC 





MAR + [MDR]; Read; WMFC 


71 


1 
mo memnon | ao 
1 


72 


Z <— [Y] + [Rdst] 


173 
> 


B37-20 Add src, Rdst 指 令 对 应 的 微 程 序 流程 图 


753 宽 转 移 导 址 方式 
图 7-20 中 在 单元 003 处 的 微 指 令 中 包括 一 个 宽 转移 。 指 令 译 码 器 (图 中 简写 为 InstDec) 生成 
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刚 被 取 入 了 巩 中 的 指令 的 微 程序 首 地 址 。 在 我 们 的 例子 中 ， 寄 存 器 了 琢 保 存 着 加 法 指令 ， 指 令 译 码 
器 为 其 产生 微 指 令 地 址 101。 但 是 ， 该 地 址 不 是 像 现 在 这 样 被 装 入 到 微 程 序 计数 器 中 。 

加 法 指令 的 源 操作 数 可 以 采用 多 种 寻 址 方式 来 几 定 。 图 中 列 出 了 加 法 指令 可 能 跟随 的 五 种 
转移 。 从 左 到 右 分 别 是 变 址 、 自 动 递 碱 、 自 动 递 增 、 寄 存 器 直接 和 寄存 器 间接 寻 址 。 上 面 描述 
的 按 位 -或 技术 可 用 来 在 该 点 修改 由 指令 译 码 器 生成 的 首 地 址 ， 使 其 到 达 正 确 的 路 径 上 。 对 于 图 
中 所 列 出 的 地 址 , 按 位 -或 操作 将 根据 指令 中 用 的 寻 址 方式 , 将 地 址 101 改 为 五 种 可 能 地 址 值 161、 
141、121、103 或 111 中 的 一 种 。 

WMFC 的 使 用 

假设 在 转移 微 指 令 中 有 可 能 发 出 一 条 等 待 MFC 的 命令 。 例 如 ， 在 单元 112 处 的 微 指令 就 是 这 
样 做 的 ， 它 生成 一 条 转向 单元 171 处 微 指令 的 转移 指令 。 将 这 两 种 操作 绑 定 在 一 起 会 带 来 一 个 小 
问题 。WMFC 信 号 意味 着 完成 微 指 令 可 能 要 用 几 个 时 钟 周期 。 如 果 允 许 在 第 一 个 时 钟 周 期 发 生 
转移 ， 那 么 就 会 过 早 地 取出 并 执行 单元 171 处 的 微 指令 。 为 了 避免 出 现 这 种 情况 ， 必 须 在 存储 器 
传送 过 程 结束 之 后 才 可 以 进行 转移 ， 也 就 是 说 在 等 待 期 间 ，WMEFC 信 和 号 必须 禁止 微 程序 计数 器 
的 内 容 发 生 任何 变化 。 

具体 的 分 析 

让 我 们 仔细 看 一 下 图 7-20 的 流程 图 中 的 一 条 路 径 。 考 虑 以 自动 递增 寻 址 方式 访问 源 操作 数 
的 情况 。 该 条 路 径 需 要 执行 指令 

Add (Rsrc) +, Rdst 


其 中 Rsrc 和 Rdst 是 机 器 中 的 通用 寄存 器 。 图 7-21 列 出 了 读 取 和 执行 该 指令 的 完整 微 程序 。 假设 指 
令 采 用 3 位 字段 来 表示 源 操 作 数 的 寻 址 方式 ， 如 图 所 示 。 位 于 第 10 位 和 第 9 位 的 位 模式 11、10 
01 和 00 分 别 表示 变 址 、 自 动 递减 、 自 动 递 增 和 寄存 器 四 种 奸 址 方式 。 对 于 每 一 种 方式 ， 都 是 用 
第 8 位 来 表示 它们 相应 的 间接 形式 。 例 如 ， 在 模式 字段 中 的 010 表 示 自 动 递增 方式 中 的 直接 形式 ， 
而 011 表 示 它 的 间接 形式 。 还 假设 处 理 器 拥有 可 以 用 于 寻 址 目的 的 16 个 寄存 器 ， 每 个 寄存 器 用 一 
个 4 位 代码 表示 。 因 此 ， 源 操 作 数 可 以 用 模式 字段 和 第 7 位 到 第 4 位 表示 的 寄存 器 完整 描述 出 来 。 
目标 操作 数 放 在 第 3 位 到 第 0 位 指定 的 寄存 器 中 。 

由 于 16 个 通用 寄存 器 中 的 任何 一 个 可 能 用 作 判 定 源 和 目标 操作 数 的 位 置 ， 所 以 微 指 令 分 别 
把 各 自 的 控制 信号 记 作 Rsreow、Rsrcm、Rdstww 和 Rdst,。 这 些 信 号 必须 由 连接 到 丽 的 Rsrc 和 Rdst 地 
址 字段 的 译 码 器 电路 转换 成 专用 寄存 器 的 传输 信号 。 这 意味 着 存在 两 个 译 码 阶段 。 第 一 个 阶段 
将 微 指 令 字段 进行 译 码 来 判定 是 否 包括 Rsrc 和 Rdst 寄 存 器 。 然 后 ， 译 码 的 输出 用 来 将 阴 中 的 Rsrc 
或 Rdst 字 段 的 内 容 传 送 到 第 二 个 译 码 器 中 ， 产 生 寄存 器 RO 到 R15 的 控制 信号 

图 7-20 中 的 微 程序 是 通过 将 模式 字段 中 的 所 有 可 能 值 进行 组 合 而 得 到 的 ， 结 果 是 生成 一 个 
需要 的 多 转移 点 结构 。 在 图 7-21 的 实例 有 两 个 转移 点 ， 从 而 需要 两 条 转移 微 指令 。 在 每 一 种 情 
形 下 ,括号 中 的 表达 式 指 示 将 要 装 入 uPC 中 的 转移 地 址 ， 以 及 该 地 址 如 何 用 按 位 -或 技术 进行 修 
改 。 我 们 用 单元 123 处 的 微 指 令 作为 分 析 的 例子 。 在 未 修改 形式 中 它 将 转移 到 170 单 元 处 的 微 指 
令 中 ， 这 会 再 次 使 用 相应 的 间接 寻 址 方式 ， 并 从 主 存 中 进行 读 取 。 对 于 直接 寻 址 方式 ， 可 以 通 
过 将 src 地 址 字段 (IR 中 的 第 8 位 ) 中 的 间接 位 求 反 后 ， 与 xPC 的 第 0 位 进行 或 操作 ， 这 样 就 可 以 
绕 过 这 一 步 的 取 指 操作 。 

使 用 按 位 -或 的 另 一 个 例子 是 单元 003 处 的 微 指令 。 实现 Add 指 令 的 微 程序 有 5 个 首 地 址 ， 根 
据 寻 址 方式 来 指定 源 操作 数 。 这 些 八进制 地 址 中 只 有 中 间 一 位 不 同 。 因 此 ， 使 用 按 位 -或 操作 来 





A 


修改 从 译 码 器 中 落得 的 模式 101 的 八进制 数 中 间 值 来 实现 所 需要 的 转移 。 由 连接 到 src 地 址 的 模式 
字段 (IR 的 第 8、9、10 位 ) 的 译 码 器 电路 提供 与 该 数 进行 或 操作 的 3 位 数 。 由 于 已 经 选择 了 微 指 
令 地址 ， 所 以 这 种 修改 很 容易 实现 ; /中 C 的 第 4 和 第 5 位 直接 由 区 的 第 9 和 第 10 位 进行 设置 。 除 了 
一 种 寻 址 方式 以 外 ， 这 种 方式 足以 为 其 他 src 的 寻 址 方式 选择 正确 的 微 指令 。 当 R.) IR] IR] 
等 于 1 时 ， 通 过 将 APC 的 第 3 位 置 1 来 屏蔽 寄存 器 的 间接 方式 。 寄存器 间接 方式 是 一 个 特殊 情形 ， 
因为 它 是 不 使 用 170 单 元 的 微 指 令 中 的 惟一 一 种 间接 方式 。 


— 
IR 的 内 容 操作 


地 址 





(八进制 ) 微 指令 
000 PC MARi Read, Select4, Add, Z, 
001 Zoun PCin Yin WMFC 
002 MDR „un IR;, 
003 HBranch {PC — 101 (从 指令 译 码 器 ); 
HPCs 4 © [Riosj UPC; — [IR] : [IR] ` [IRsj) 
121 Rsrco MAR;,,, Read, Select4, Add, Z 
122 Zour Rsrc;, 
123 hBranch {PC <— 170; MPCo — [IRg]}, WMFC 
170 MDR.,,, MAR,,, Read, WMFC 
171 MDR pur Yin 
172 Rdst,„n SelectY Add, Z;, 
173 Zour Rdst;,, End 


图 7-21 Add (Rsrc) +, Rdst 的 微 指 令 
注 : 对 于 这 种 寻 址 方式 ， 不 执行 单元 170 处 的 微 指令 。 


7.5.4 带 有 下 一 地 址 字段 的 微 指令 


图 7-20 中 的 微 程序 需要 多 条 转移 微 指令 ,这 些微 指令 不 执行 数据 通路 中 的 有 效 操作 ; 它们 只 
是 用 来 确定 下 一 条 微 指令 的 地 址 ， 因 此 降低 了 计算 机 的 操作 速度 。 当 其 他 微 指令 被 考虑 进来 时 
这 种 情形 会 变 得 更 糟 。 如 果 增 加 转移 微 指令 ， 往 往 会 对 通常 连续 执行 的 所 有 微 指令 分 配 连续 地 
址 的 能 力 产 生 限 制 。 

该 问题 促使 我 们 重新 评估 建立 在 可 递增 的 UPC 基 础 上 的 顺序 技术 。 一 种 有 效 的 替代 方法 是 
在 每 条 微 指令 中 增加 一 个 地 址 字段 来 指示 要 提取 的 下 一 条 微 指 令 的 位 置 。 实 际 上 ， 这 意味 着 每 
条 微 指令 除了 具有 其 他 功能 以 外 ， 还 是 一 条 转移 微 指令 。 

这 种 灵活 性 是 通过 对 地 址 字段 增加 附加 的 位 而 得 到 的 。 这 种 损失 的 严重 性 评估 如 下 : 在 典 
型 计算 机 中 ， 用 不 超过 4kK 的 微 指令 来 设计 一 个 完整 微 程序 ， 其 中 每 条 微 指令 大 约 占 50 到 80 位 。 
这 表示 要 求 有 12 位 地 址 字段 。 因 此 ， 大 约 需 要 六 分 之 一 的 控制 存储 器 容量 用 于 寻 址 。 即 使 需要 


+ 
> 
Dej 
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扩展 微 程序 ， 也 只 能 将 地 址 字段 稍微 有 所 增 大 。 

这 种 方法 的 最 显著 优点 是 几乎 省 去 了 单独 的 转移 微 指令 。 而 且 ， 微 指令 的 地 址 分 配 也 几乎 不 
受 限制 。 这 些 优点 大 大 抵消 了 它 的 负面 影响 ， 也 使 得 该 技术 很 具有 吸引 力 。 由 于 每 条 指令 包含 下 
一 条 指令 的 地 址 ， 所 以 不 需要 计数 器 来 记录 顺序 地 址 。 因 此 ，HPC 用 微 指令 地 址 寄存 器 (LAR ) 
来 代替 ， 将 每 条 微 指 令 的 下 一 个 地 址 字段 域 装 和 人 HUAR。 具 有 该 特性 并 且 支 持 按 位 -或 操作 的 新 控 
制 结构 如 图 7-22 所 示 。 下 一 个 地 址 位 经 过 或 门 传送 给 UAR， 以 便 地 址 可 在 玉 中 的 数据 、 外 部 输入 
和 条 件 码 的 基础 上 进行 修改 ， 译 码 器 电路 在 耻 中 操作 码 的 基础 上 产生 指定 微 程序 的 起 始 地 址 。 

现在 运用 图 7-22 的 微 程序 控制 结构 重新 考虑 图 7-21 的 例子 。 我 们 需要 几 条 控制 信号 ， 这 些 控 
制 信号 不 包含 在 图 7-19 的 微 指 令 格式 中 。 用 名 称 Rsrc 和 Rdst 作 为 对 寄存 器 RO 到 R15 描述 的 替换 ， 
它们 可 根据 职 中 src 和 dst 字 段 的 数据 译 成 实际 控制 信号 。 带 有 按 位 -或 技术 的 转移 要 求 在 微 指令 
中 包括 适当 的 命令 。 在 图 7-20 的 流程 图 中 ，003 单 元 的 微 指 令 中 根据 源 操作 数 的 寻 址 方式 使 用 按 
位 -或 的 方法 来 判断 下 一 条 微 指 令 的 地 址 。 寻 址 方式 由 指令 寄存 器 中 的 第 8 位 到 第 10 位 表示 ， 如 
图 7-21 所 示 。 信 号 ORwoue 用 来 控制 是 否 使 用 按 位 -或 技术 。 在 微 指 令 123、143 和 166 中 ， 采 用 按 
位 -或 来 判断 源 操 作 数 是 否 使 用 间接 寻 址 。 信 号 ORwur 就 是 用 于 此 目的 的 。 为 了 简单 起 见 ， 我 们 
利用 微 指 令 中 单独 的 位 来 表示 这 些 信号 。 利 用 微 指令 中 一 位 来 表示 指令 译 码 器 的 输出 何 时 传送 
到 KAR 中 。 最 后 ， 每 条 微 指令 中 包含 下 一 条 微 指令 地 址 的 8 位 字段 。 图 7-23 是 这 类 微 指令 的 一 个 
完整 格式 ， 这 个 格式 是 对 图 7-19 中 格式 的 扩充 。 


g — 


= 一 


- 


控制 信号 
图 7-22 微 指 令 顺 序 结构 
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我 们 可 以 采用 这 类 微 指令 来 实现 图 7-21 的 微 程序 ， 如 图 7-24 所 示 。 修 改 后 的 程序 将 少 一 条 微 
指令 。 因 为 我 们 将 单元 123 处 的 转移 微 指令 与 它 的 前 一 条 微 指令 合并 。 当 微 指 令 时 序 由 uPC 控 制 
时 ，End 信 号 用 于 APC 复 位 ， 使 它 指向 取出 并 要 执行 的 下 一 条 机 器 指令 微 指令 的 首 地 址 。 在 我 们 
的 例子 中 ， 这 个 首 地 址 是 0008。 不 过 图 7-24 中 的 微 程序 并 不 会 因为 产生 End 信 号 而 终止 。 在 这 类 
结构 中 ， 一 般 起 始 地 址 并 不 是 采用 由 End 信 号 触发 的 复位 机 制 来 指定 的 ， 相 反 是 采用 显 式 方式 在 
F0 字 段 中 指定 的 。 
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下 一 微 指 令 000: No transfer 000: No transfer 000: No transfer 


地 址 001: PC; 001: PC;, 001: MAR;, 
010: MDR pur 010: IR;, 010: MDR;, 
011: Zout 011: Zin 011: TEMP; 
100: Rsrc;;, 100: Rsrc;, 100: Yin 


101: Rdst,y 101: Rdst,, 
110: TEMP 


m | = | = [L >” ] 














F4(4 位 ) FS5 (2 位 ) F6 (1 位 ) F7 (1 位 ) 
0000: Add 00: No action 0: SelectY 0: No action 
0001: Sub 01: Read 1: Select4 1: WMFC 


: 10: Write 
1111: XOR 


F8 (1 位 ) F9 (1 位 ) F10 (1 位 ) 
0: NextAdrs 0: No action 0: No action 
1 InstDec 1: OR mode 1: ORingsre 





图 7-23 7.5.3 节 中 实例 的 微 指 令 格式 


图 7-25 中 给 出 了 图 7-22 控 制 结构 的 更 加 具体 的 图 示 。 它 给 出 了 控制 信号 如 何 从 微 指令 字段 中 
译 出 以 及 如 何在 控制 序列 中 使 用 。 在 图 7-26 中 给 出 了 按 位 -或 的 具体 电路 。 


75.5 预 取 微 指令 
微 程序 控制 的 一 个 缺点 是 它 导 致 了 操作 速度 的 降低 ， 因 为 从 控制 存储 器 读 取 微 指令 要 花费 


一 些 时 间 。 如 果 在 当前 微 指令 执行 的 同时 预 取 下 一 条 微 指令 就 可 以 获得 较 快 的 操作 速度 。 在 这 
种 方法 中 ， 执 行 时 间 与 取 指 令 时 间 是 重 双 的。 
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00000001 0101100 : i 
00000010 011; 001: IU: 0000 oo o 
00000011 010 010 000 0000 00. o 
| 0000000 000 000000 0000 00 0; 


— — — — + — + < + — + — —1 + 


01010010 100) 0110010000 01 $ 
01111000 100) 000 00:0. 














01111001. 010; 000; 0041 
171 O1111010 010, 000 100; 
173 00000000 01I 19199 
00000000 | | | 





其 他 控制 信号 
图 7-25 控制 信号 生成 电路 的 一 些 具体 细节 
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性 术 pH — ‘O 


IR,o IRo IRg 





BAR; MAR4 RAR, BAR, 
图 7-26 按 位 -或 控制 电路 (图 7-25 中 译 码 电路 的 一 部 分 ) 


预 取 微 指令 为 系统 的 结构 带 来 一 些 困 难 。 有 时 ， 状 态 标志 位 和 当前 执行 的 微 指 令 的 操作 结 
果 要 用 来 判定 下 一 条 微 指 令 的 地 址 。 因 此 ， 直 接 预 取 侦 尔 会 发 生 取 错 微 指令 的 情况 。 这 时 ， 必 
须 按照 正确 地 址 重 取 ， 这 就 需要 有 比较 复杂 的 硬件 结构 。 虽 然 这 种 技术 存在 一 些微 小 的 环 症 ， 
不 过 对 于 这 种 预 到 技术 人 们 还 是 认可 的 ， 并 经 常会 采用 它 。 


7.5.6 仿真 


微 程序 控制 的 主要 功能 是 为 机 器 指令 的 执行 提供 一 种 简单 、 灵 活 、 相 对 便宜 的 方法 。 然 而 
它 也 带 来 了 其 他 的 好 处 。 它 在 使 用 机 器 资源 方面 具有 一 定 的 灵活 性 ， 所 以 可 以 实现 各 类 指令 。 
在 一 台 给 定 的 具有 某 种 指令 集 的 计算 机 上 ， 有 可 能 去 定义 其 他 的 机 器 指令 并 利用 附加 的 微 程序 
来 实现 这 些 机 器 指令 。 

对 前 面 的 想法 进行 扩展 可 以 带 来 另 一 种 有 趣 的 可 能 性 。 假 设 我 们 为 给 定 计算 机 Mi1 增 加 一 个 
全 新 的 指令 集 ， 实 际 上 该 指令 集 是 另 一 台 计算 机 M2 的 指令 集 。 采 用 M2 的 机 器 语言 编写 的 程序 
可 在 计算 机 M1 上 运行 ， 即 M1 仿真 M2。 仿 真 使 我 们 能 够 用 较 新 的 机 器 来 代替 过 时 的 机 器 。 如 果 
用 作 替 代 的 计算 机 能 够 完全 地 仿真 原 计算 机 ， 那 么 对 于 现存 的 程序 不 必 做 任何 软件 上 的 更 改 便 
可 以 运行 。 因 此 ， 仿 真 技术 可 以 使 得 计算 机 系统 的 过 渡 变 得 容易 ， 并 且 改 动 较 少 。 

当 所 涉及 的 机 器 具有 相似 的 体系 结构 时 ， 仿 真 就 更 加 容易 。 不 过 ， 对 于 完全 不 同 的 体系 结 
构 ， 仿 真 也 是 可 以 实现 的 。 


7.6 结束 语 


在 本 章 中 ,我 们 全 面 介绍 了 计算 机 中 央 处 理 器 的 结构 。 商 用 机 所 使 用 的 结构 是 我 们 所 提 
出 结构 的 各 种 变种 。 对 于 一 种 具体 结构 的 选择 往往 涉及 到 执行 速度 与 实现 成 本 之 间 的 权衡 。 
其 他 因素 如 采用 的 技术 、 修 改 的 灵活 性 以 及 计算 机 指令 集 需要 的 特殊 功能 等 ， 也 起 到 一 定 的 
作用 。 

在 这 里 还 介绍 了 实现 处 理 器 控制 部 件 的 两 种 方法 一 一 硬件 控制 和 微 程序 控制 。 当 所 关心 的 


是 操作 速度 时 ， 硬 件 控制 是 最 好 的 方法 。 而 在 实现 指令 集 方面 ， 微 程序 控制 提供 了 相当 大 的 灵 
活性 。 
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习题 


7.1 


7.2 


7.3 
7.4 


7.5 


7.6 


7.7 


7.8 


7.9 


7.10 
7.11 


7.12 


7.13 


7.14 


7.15 


当 从 主 存储 器 读 出 或 向 主 存储 器 写 人 的 时 候 ， 为 什么 需要 等 待 存储 器 功能 完成 ( WMFC) 
这 一 步 ? 
一 个 处 理 器 使 用 类 似 于 图 7-6 的 控制 序列 。 假 设 存储 器 读 或 写 操作 与 一 个 内 部 处 理 器 操作 占 
用 相同 的 时 间 ， 并 且 处 理 器 和 存储 器 由 同一 时 钟 控制 。 估 算 一 下 这 个 序列 的 执行 时 间 。 
对 于 一 台 存储 器 访问 时 间 等 于 处 理 器 时 钟 周期 两 倍 的 机 器 ， 重 新 回答 7.2 的 问题 。 
假设 沿 总 线 传输 的 时 间 延 迟 和 经 过 图 7-1 中 ALU 的 时 间 延 迟 分 别 是 0.3ns 和 2ns。 寄 存 器 建立 
的 时 间 是 0.2ns， 保 持 时 间 是 0。 所 需要 的 最 小 时 钟 周期 是 多 少 ? 
为 下 列 每 条 指令 写 出 图 7-1 的 总 线 结构 所 要 求 的 控制 步 : 
(a) 将 (立即 ) 数 NUM 与 寄存 器 R1 相 加 。 
(b) 将 存储 器 单元 NUM 处 的 内 容 与 寄存 器 R1 相 加 。 
(c) 将 地 址 在 存储 器 单元 NUM 中 的 内 容 与 寄存 器 R1 相 加 。 
假设 每 条 指令 由 两 个 字 构 成 。 第 一 个 字 表明 操作 和 寻 址 方式 ， 第 二 个 字 包 含 数 NUM。 
在 习题 7.5 的 三 条 指令 中 有 许多 通用 的 控制 步 。 然 而 ， 这 些 控制 步 中 有 一 些 发 生 在 控制 步 计 
数 器 的 不 同 计数 处 。 给 出 一 种 利用 这 些 步 来 降低 图 7-11 的 编码 器 块 复杂 度 的 方法 。 
考虑 具有 图 7-6 给 出 的 控制 序列 的 加 法 指令 。 处 理 器 被 连续 运行 的 时 钟 所 驱动 以便 在 一 个 
持续 期 间 里 每 一 个 控制 步 都 是 2ns。 假 设 存储 器 的 读 操作 需要 占用 16ns， 那 么 ， 处 理 器 在 第 
2 步 和 第 5 步 要 等 待 多 久 ? 在 这 条 指令 执行 期 间 ， 处 理 器 空闲 时 间 占 多 少 百分比 ? 
一 台 32 位 的 按 字 节 可 寻 址 的 机 器 ， 其 寻 址 方式 包括 自动 递增 和 自动 递减 方式 。 在 这 两 种 方 
式 中 ， 根 据 操作 数 的 长 度 ， 地 址 寄存 器 的 内 容 分 别 增加 或 减少 1、2 或 4。 对 图 7-1 进 行 一 些 
修改 以 简化 这 种 操作 。 
对 于 在 图 7-1 的 处 理 器 上 执行 的 指令 

MUL RI,R2 


给 出 一 种 可 行 的 控制 序列 。 这 条 指令 将 寄存 器 R1 和 R2 的 内 容 相 乘 ， 将 结果 存在 R2 中 。 在 乘 
积 中 如 果 还 有 高 位 部 分 ， 就 丢弃 。 根 据 需 要 建议 补充 控制 信号 ， 并 假设 多 路 复 用 器 的 结构 
如 图 6-7 所 示 。 

对 于 一 个 包含 图 7-8 给 出 结构 的 处 理 器 ， 写 出 负数 转移 (Branch-on-Negative) 指令 的 控制 步 。 
写 出 用 来 执行 第 3 章 中 描述 的 转移 到 子 程序 (Branch-to-Subroutine) 指令 的 控制 步 。 假 设 处 
理 器 拥有 图 7-1 的 内 部 结构 。 

对 于 图 7-8 中 的 处 理 器 ， 重 新 回答 7.11 的 问题 。 

图 7-3 是 用 于 实现 处 理 器 寄存 器 边沿 触发 的 触发 器 。 考 虑 将 数据 从 一 个 寄存 器 传送 到 另 -一 
个 寄存 器 的 操作 。 如 果 边 沿 触发 触发 器 被 诸如 图 A-27 中 的 简单 门 控 锁 存 器 代替 ， 仔 细 分 析 
该 操作 的 时 序 并 解释 可 能 遇 到 的 任何 潜在 困难 。 

图 7-3 中 的 多 路 复 用 器 和 反馈 连接 消除 了 对 时 钟 输入 进行 控制 的 需求 ， 它 是 作为 寄存 器 输 
人 的 一 种 使 能 方式 。 运 用 时 序 图 解释 可 能 发 生 的 问题 ， 假 设 采 用 时 钟 控制 。 

假设 图 7-8 中 的 寄存 器 文件 用 作 RAM。 在 任何 一 个 给 定 的 时 间 里 ， 该 RAM 中 的 位 置 可 由 读 
或 写 操作 访问 。 在 操作 R1~ [R1] + [R2] 期 间 ， 寄 存 器 RI 既是 源 寄存 器 又 是 目标 寄存 器 。 阅 
述 在 主 从 模式 中 如 何在 RAM 的 输入 端 或 输出 端 运用 新 添 的 锁 存 器 来 操作 文件 。 利 用 时 序 
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7.16 


1.17 


7.18 


7.19 


7.20 


7.22 


图 解释 你 的 新 设计 如 何 使 寄存 器 R1 在 同一 时 钟 周 期 中 既 用 作 源 寄存 器 又 用 作 目 标 寄存 器 。 
在 图 7-11 中 将 Run 信 号 置 为 0， 以 阻止 在 等 待 存储 器 读 或 写 操作 完成 时 控制 步 计 数 器 增加 。 
查看 图 7-5 中 的 时 序 图 ， 画 出 产生 该 信号 的 控制 电路 状态 图 。 设 计 一 个 合适 的 电路 。 
MDRwz 控制 信号 随 着 在 一 个 时 钟 周期 中 控制 信号 Read 被 确定 而 确定 ， 而 当 存 储 器 传送 完 
成 后 被 取消 ， 如 图 7-5 所 示 。 设 计 一 个 合适 的 电路 生成 MDRue。 

考虑 一 台 含 有 图 7-1 中 结构 的 16 位 可 按 字 节 寻 址 的 机 器 。 偶 地 址 和 奇 地 址 的 字 节 分 别 在 存 
储 器 总 线 的 高 8 位 和 低 8 位 上 传送 。 给 出 一 种 合适 的 控制 方法 ， 将 寄存 器 MDR 连 接 到 存储 
器 总 线 和 内 部 处 理 器 总 线 上 允许 进行 字 节 传送 。 当 保存 字 节 时 ， 它 应 总 是 在 处 理 器 内 部 的 
低位 字 节 上 。 

利用 反 相 器 和 延迟 元 件 设计 一 个 振荡 器 。 假 设 延迟 元 件 引 入 延迟 7， 振 荡 频 率 是 多 少 ? 

对 振荡 器 进行 修改 ， 使 其 可 以 在 同步 输入 RUN 的 控制 下 启动 和 停止 。 当 振荡 器 被 停止 时 ， 
输出 的 最 后 一 个 脉冲 宽度 必须 等 于 T， 该 时 间 是 使 RUN 变 为 非 活 动 状 态 的 一 个 独立 时 间 。 
处 理 器 中 一 些 控制 步 的 完成 比 其 他 的 控制 步 占 用 的 时 间 长 。 希 望 产生 一 个 由 Long/Short 售 
号 控制 的 时 钟 信号 ， 使 得 当 该 信号 等 于 1 时 控制 步 的 持续 时 间 是 它 的 两 倍 长 度 。 假 设 控制 
步 计数 器 有 一 个 允许 输入 端 ， 并 且 计 数 器 在 时 钟 上 升 沿 如 果 Enable=1 时 递增 。 设 计 一 个 产 
生 Enable 信 号 的 电路 以 便 根 据 需 要 改变 控制 步 的 大 小 。 

将 移 位 寄存 器 的 输出 反 相 后 反馈 到 它 的 输入 端 ， 以 形成 一 个 叫做 Johnson 计 数 器 的 计数 电路 。 
(a) 4 位 Johnson 计 数 器 的 计数 序列 是 什么 ， 从 状态 0000 开 始 ? 

(b) 说 明 如 何 运用 Johnson 计 数 器 来 产生 图 7-11 中 的 定时 信号 Ti、T: 等 ， 假 设 最 大 的 时 间 间 
隔 为 10。 

一 个 处 理 器 的 ALU 使 用 如 图 P7-1 所 示 的 移 位 寄存 器 来 实现 移 位 和 循环 移 位 操作 。 该 寄存 器 
的 控制 逻辑 输入 包括 : 

ASR RAB 

LSR 
SL 
ROR 
LD 





控制 线 及 申 行 输入 
图 P7-1 习题 7.22 中 移 位 寄存 器 的 控制 结构 
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7.23 


7.24 


7.25 


7.26 


7.27 


7.28 


7.29 


所 有 的 移 位 和 取 操作 由 一 个 时 钟 输入 控制 。 移 位 寄存 器 由 边沿 触发 D 触 发 器 实现 。 为 控制 逻 
辑 和 移 位 寄存 器 的 wm，ri 和 ns 位 夯 出 一 个 完整 的 逻辑 图 。 
图 P7-2 的 数字 控制 器 有 三 个 输出 X、Y 和 2Z 以 及 两 个 输入 A 时 钟 | 
和 B。 它 由 外 部 时 钟 驱动 。 控 制 器 连续 经 历 下 列 事件 : 在 一 
第 一 个 时 钟 周 期 的 开始 ，X 线 置 为 1。 在 第 二 个 时 钟 周期 _ 
的 开始 ，Y 线 或 Z 线 置 1， 这 分 别 取决 于 在 前 一 时 钟 周 期 里 — 。 ag 
A 线 等 于 1 还 是 0。 接 着 控制 器 等 待 直到 B 线 置 为 1。 在 下 一 二 | > 
个 时 钟 的 上 升 沿 ， 控 制 器 置 输出 Z 为 1， 持 续 时 间 为 1 个 时 
钟 周期 。 接 着 将 所 有 输出 信号 复位 为 0， 持 续 时间 为 1 个 时 图 P72 习题 723 中 的 数字 控制 器 
钟 周期 。 该 序列 是 重复 的 ， 从 下 一 时 钟 的 上 升 沿 开始 。 为 这 个 控制 器 画 出 状态 图 并 给 出 一 
个 合适 的 远 辑 设计 。 
为 指令 

MOV X (Rsrc), Rdst 


写 一 个 像 图 7-21 所 示 的 微 程序 ， 其 中 源 和 目标 操作 数 分 别 以 变 址 和 寄存 器 寻 址 方式 指定 。 
BGT (Branch if>0) 机 器 指令 以 表达 式 Z+ (NOV) = 0 作为 它 的 转移 条 件 ， 其 中 Z、N 和 V 分 
别 是 零 、 负 数 、 谥 出 条 件 标志 。 写 出 一 个 能 够 实现 这 条 指令 的 微 程 序 。 画 出 用 来 测试 条 件 
码 的 电路 。 
写 一 个 能 实现 BGT ( 如果 大 于 零 转 移 )、BPL ( 如果 为 正 转移 ) 和 BR (无 条 件 转移 ) 指令 
的 联合 微 程序 。BGT 和 BPL 指 令 的 转移 条 件 分 别 是 Z + (N @V)=0 和 N = 0。 所 需要 的 微 指 
令 总 数 是 多 少 ? 如 果 每 条 机 器 指令 使 用 一 个 单独 的 微 程序 ， 需 要 多 少 条 微 指 令 ? 
图 7-21 是 一 个 微 程 序 实例 ， 其 中 按 位 -或 用 于 修改 微 指令 地 址 。 写 一 个 不 使 用 按 位 -或 而 使 
用 条 件 转移 微 指令 的 等 价 程序 。 需 要 补充 多 少 微 指令 ? 异 没 条 什 转 移 微 指令 可 用 于 测试 民 
中 的 一 些 位 。 
指出 图 7-20 的 微 程序 应 如 何 修改 以 执行 68000 微 处 理 器 指令 

ADD src, Rdst 
说 明 图 7-20 的 流程 图 应 如 何 修改 以 实现 一 般 指 令 

MOVE src, dst 
其 中 源 和 目标 都 可 以 使 用 所 示 的 五 种 寻 址 方式 中 的 任何 -种 。 
图 7-3 给 出 了 对 应 于 微 程序 计算 机 中 机 器 指令 的 微 指令 序列 的 一 部 分 。 微 指令 B 后 是 C、E、 
F 或 1， 这 取决 于 机 器 指令 寄存 器 的 be。 和 bs 位 。 比 较 下 列 描述 的 三 种 可 能 实现 方式 。 
(a) 微 指令 序列 通过 微 程序 计数 器 实现 。 由 微 指令 形式 

If bbs branchto X 

实现 转移 ， 其 中 beb; 是 转移 条 件 ，X 是 转移 地 址 ， 
(b) 与 a 部 分 相同 ， 除 了 转移 微 指令 的 形式 是 

Branch to X,OR 
其 中 X 是 基本 转移 地 址 。 转 移 地 址 由 bs 和 bs 位 以 及 X 中 的 相应 位 按 位 -或 进行 修改 。 
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图 P7-3 习题 7.30 用 到 的 微 指令 序列 方式 


(0) 每 条 微 指令 中 的 一 个 字段 表明 下 一 条 微 指令 的 地 址 ， 它 含有 按 位 -或 的 性 能 。 

对 于 a 到 c 部 分 的 每 一 种 实现 ， 为 图 P7-3 中 的 所 有 微 指 令 分 配合 适 的 地 址 。 注 意 在 一 些 情形 
下 你 可 能 需要 插入 转移 指令 。 可 以 选择 任意 地 址 ， 只 要 它们 与 所 使 用 的 序列 方法 一 致 。 例 
如 ， 在 a 部 分 你 可 以 选择 地 址 如 下 : 








地 hk 微 指 令 

00010 A 

00011 B 

00100 If bebs = 00 branch to XXXXX 
XXXXX cC 





我 们 希望 减少 图 7-19 中 控制 信号 编码 所 需要 的 位 数 。 推 荐 一 种 新 编码 ， 使 位 数 减 少 两 位 。 
新 编码 将 如 何 影响 实现 一 条 指令 所 需要 的 控制 步 数量 ? 

为 图 7-19 中 控制 信号 推荐 一 种 新 编码 ， 使 一 条 微 指令 所 需要 的 位 数 减少 到 12。 指 出 新 编码 
对 图 7-6 和 图 7-7 中 控制 序列 的 影响 。 

为 微 指令 推荐 一 种 格式 ， 类 似 于 图 7-19， 假 定 处 理 器 的 结构 如 图 7-8 所 示 。 

横向 和 纵向 微 指令 格式 的 相对 优点 是 什么 ? 将 你 的 答案 与 习题 7.31 和 习题 7.32 的 答案 联系 
起 来 考虑 。 

硬件 控制 和 微 程序 控制 的 优点 和 缺点 是 什么 ? 
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本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

“ 并行 执行 机 器 指令 的 流水 线 方式 

“ 引起 流水 线 处 理 器 性 能 下 降 的 各 种 阻塞 以 及 降低 阻塞 影响 的 方法 
“流水线 中 的 硬件 和 软件 含义 

“ 流水 线 对 指令 集 设计 的 影响 

“ 超标 量 处 理 器 


在 前 面 的 章节 中 介绍 了 计算 机 的 基本 构件 块 。 在 本 章 中 ， 我 们 详细 讨论 在 现代 计算 机 中 用 
来 获取 更 高 性 能 的 流水 线 技术 。 首 先 阅 述 流水 线 的 基础 以 及 它 是 如 何 改 善 性 能 的 。 然 后 验证 便 
于 流水 线 执行 的 机 器 指令 特征 ， 并 证 明 指令 和 指令 序列 的 选择 对 性 能 有 重大 影响 。 流 水 线 结构 
需要 娴熟 的 编译 技术 ， 而 用 于 这 一 目标 的 优化 编译 器 已 开发 出 来 。 相 对 于 其 他 编译 器 ， 这 种 纺 
译 器 重新 安排 操作 顺序 以 使 流水 线 尽 可 能 发 挥 出 最 大 作用 。 


81 基本 概念 


程序 执行 的 速度 受到 许多 因素 影响 。 提 高 性 能 的 一 种 方法 是 利用 快速 电路 技术 来 设计 处 理 
器 和 主 存储 器 ， 另 一 种 可 能 是 对 硬件 进行 调整 ， 使 其 能 在 同一 时 间 里 执行 多 项 操作 。 采 用 后 一 
种 方法 ， 即 使 用 到 的 每 一 种 操作 所 需 的 执行 时 间 都 不 改变 ， 每 秒 执行 操作 的 次 数 也 会 增加 。 

前 面 已 经 多 次 碰 到 过 并 发 动作 。 在 第 1 章 中 ， 我 们 介绍 了 多 道 程序 的 概念 ， 并 阐述 了 如 何 才 
能 将 WO 传输 与 计算 活动 同时 进行 。DMA 设 备 使 其 成 为 可 能 ， 因 为 一 旦 VO 传送 由 处 理 器 启动 后 ， 
DMA 设 备 就 可 以 独立 地 执行 WO 传送 。 

在 计算 机 系统 中 ， 流 水 线 是 组 织 并 发 活动 的 一 个 非常 有 效 的 方法 ， 它 的 基本 思想 很 简单 。 
在 制造 工厂 里 经 常会 看 到 流水 线 ， 那 里 的 流水 线 通常 是 作为 装配 线 操作 的 。 毫 无 疑问 ， 读 者 对 
汽车 制造 三 中 用 到 的 装配 线 是 很 熟悉 的 。 装 配 线 的 第 一 站 准备 汽车 底盘 ， 第 二 站 安装 车 身 ， 下 
一 站 安装 发 动机 等 等 。 当 一 些 工人 在 一 辆 汽车 上 安装 发 动机 时 ， 另 一 些 人 在 另 一 辆 汽车 的 底盘 
上 安装 车 身 ， 还 有 一 些 人 为 第 三 辆 车 准备 新 的 底盘 。 虽 然 在 一 辆 给 定 的 车 上 完成 这 些 工作 可 能 
会 花费 几 天 时 间 ， 但 是 每 隔 几 分 钟 会 有 一 辆 新 车 从 装配 线 的 末端 开 出 来 。 

考虑 一 下 流水 线 的 思想 如 何 能 用 于 计算 机 中 。 处 理 器 通过 将 指令 逐个 取出 并 完成 执行 来 处 
理 一 道 程序 。 设 F; 和 Bi 表示 指令 0 的 取 指令 与 执行 指令 阶段 。 一 道 程序 的 执行 过 程 中 包含 一 系列 
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取 指 令 和 执行 指令 的 阶段 ， 如 图 8-1a 所 示 。 
现在 假设 一 台 计算 机 有 两 个 独立 的 硬 部 件 ， 一 个 用 来 取 指令 ， 另 一 个 用 来 执行 指令 ， 如 图 


8-1b 所 示 。 从 取 指 令 部 件 取 的 指令 存 入 中 间 存 — 时 间 


l L b 


储 缓冲 器 B1 中 。 使 用 缓冲 器 的 目的 是 为 了 使 
执行 部 件 在 执行 当前 指令 的 同时 ， 取 指令 部 
件 可 以 取 下 一 条 指令 。 操 作 的 结果 保存 到 由 ~ — 
指令 指定 的 目标 位 置 中 。 为 了 便于 讨论 ， 我 a) 顺序 执行 
们 假设 指令 操作 的 源 操作 数 和 目标 操作 数 都 
在 标 为 “执行 部 件 ” 的 模块 内 部 。 

计算 机 是 由 时 钟 控制 的 ， 任 何 一 个 指令 
的 读 取 和 执行 阶段 都 能 够 在 一 个 时 钟 周期 内 
完成 。 计 算 机 的 操作 过 程 如 图 8-1c。 在 第 一 个 
时 钟 周 期 ， 取 指令 部 件 读 取 指 令 0 ( 步 又 F,) 
并 在 时 钟 周 期 末 将 它 存储 在 缓冲 器 B1 中 。 在 





中 间 存 储 缓冲 器 
B1 





第 二 个 时 钟 周期 ， 取 指令 部 件 进行 指令 I ( 步 b) 便 件 结构 

RF) 的 取 指 令 操作 。 同 时 ， 执 行 部 件 执行 由 

指令 0 指定 的 操作 。 指 令 0 可 以 从 缓冲 器 B1 中 am 5 5 Zhu 
(HRE) 得 到 。 到 第 二 个 时 钟 周期 末 ， 指 令 

5 的 执行 结束 并 且 指 令 D 已 经 取出 。 指 令 D 取 代 指令 

不 再 需要 的 0 存储 在 Bl 中 ， 由 执行 部 件 在 第 三 h [a [E] 

个 时 钟 周期 执行 步 双色 ， 同 时 取 指令 部 件 取 指 一 

令 B。 在 这 种 方式 下 ， 取 指令 部 件 和 执行 部 件 É 


都 一 直 处 于 工作 状态 。 如 果 图 8-1c 中 的 方式 能 
维持 很 长 时 间 ， 那 么 指令 执行 的 完成 率 会 是 
图 8-1a 描 述 的 顺序 操作 的 两 倍 。 S 流水 线 执行 

总 之 ， 图 8-1b 中 的 取 指令 部 件 和 执行 部 件 图 8-1 指令 流水 线 的 基本 思想 
构成 2 段 流水 线 。 在 流水 线 中， 每 一 段 实现 指令 处 理 中 的 一步。 中 间 存 储 缓冲 器 B1 用 来 存储 从 一 
段 传递 到 另 一 段 的 信息 。 在 每 一 个 时 钟 周 期 末 ， 新 的 信息 装 入 这 个 缓冲 器 。 

指令 的 处 理 并 不 是 必须 只 分 成 两 步 。 例 如 ， 流 水 线 处 理 器 可 以 采用 四 步 来 处 理 指令 ， 如 下 : 

F 取 指 : 从 存储 器 中 读 指令 

D Em: 指令 译 码 并 取 源 操作 数 

E 执行 执行 指令 指定 的 操作 

W 写 : 将 结果 保存 到 目标 位 置 

这 种 情况 的 事件 顺序 如 图 8-2a 所 示 。 在 任何 时 刻 都 有 四 条 指令 在 执行 。 这 意味 着 需要 四 个 
不 同 的 硬 部 件 ， 如 图 8-2b 所 示 。 这 些 部 件 必 须 能 够 同时 执行 它们 的 任务 并 且 相互 之 间 没 有 干扰 ， 
信息 通过 存储 缓冲 器 从 一 个 部 件 传递 到 另 -一 个 部 件 。 当 指令 通过 流水 线 时 ， 下 游 各 段 所 需要 的 
所 有 信息 必须 跟着 传递 。 例 如 ， 在 第 4 个 时 钟 周 期 ， 缓 冲 器 中 的 信息 如 下 : 

“缓冲 器 B1 存 有 指令 6， 它 在 第 3 个 周期 取出 并 且 正 由 指令 译 码 部 件 进行 译 码 。 

“缓冲 器 B2 存 有 指令 的 源 操作 数 以 及 要 执行 的 操作 的 说 明 。 该 信息 由 译 码 硬件 在 第 3 个 周 
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期 产生 。B2 还 存 有 指令 I 的 写 阶段 (PEW) 所 需要 的 信息 。 即 使 E 段 不 需要 该 信息 ， 该 
信息 也 必须 在 随后 的 时 钟 周 期 传递 给 W 段 ， 以 使 该 段 能 执行 所 要 求 的 写 操作 。 
* 缓冲 器 B3 存 有 执行 部 件 产生 的 结果 以 及 指令 LIL 的 目标 信息 。 


8.1.1 高 速 缓存 的 作用 


我 们 希望 流水 线 的 每 一 段 都 能 在 一 个 时 钟 周 期 内 完成 它 的 操作 。 因 此 ， 时 钟 周期 应 恋足 够 
长 以 便 在 任 一 阶段 上 执行 的 任务 都 可 以 完成 。 如 果 不 同 的 部 件 需 要 的 时 间 不 同 ， 那 么 时 钟 周期 
必须 以 最 长 的 任务 完成 时 间 为 准 。 提 前 完成 任务 的 部 件 在 余下 的 时 钟 周期 中 处 于 空闲 状态 。 所 
以 ， 如 果 不 同 段 的 任务 所 需 的 时 间 大 致 相同 ， 那 么 流水 线 对 性 能 的 提高 会 非常 有 效 。 

— 时 间 
时 钟 辕 期 1 2 3 4 5 6 7 
指令 
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a) 分 成 四 步 的 指令 执行 


段 间 缓 冲 器 
D: 指令 译 
F: 取 指令 I 码 并 取 操 I ai | W: 写 结果 
作 数 
BI B2 B3 | 
b) 硬件 结构 


图 8-2 一 条 4 段 流水 线 


这 种 考虑 对 于 取 指 令 阶 段 尤其 重要 。 在 图 8-2a 中 取 指 令 阶段 安排 了 一 个 时 钟 周期 ， 时 钟 周 
期 必须 等 于 或 大 于 完成 取 操 作 所 需要 的 时 间 。 然 而 ， 主 存储 器 的 访问 时 间 可 能 是 处 理 器 内 部 执 
行 基本 流水 线段 操作 时 间 的 十 倍 ， 例 如 两 个 数 相 加 。 因 此 ， 如 果 每 条 指令 都 要 从 主 存储 器 中 读 
取 ， 流 水 线 就 没有 什么 价值 了 。 

高 速 缓冲 存储 器 RRT) 的 使 用 解决 了 存储 器 访问 的 问题 。 尤 其 当 高 速 缓存 与 处 理 器 
在 同一 芯片 上 时 ， 高 速 缓存 的 访问 时 间 通 常 与 执行 处 理 器 内 其 他 基本 操作 所 需要 的 时 间 相 同 。 
这 就 可 以 将 指令 的 读 取 和 处 理 分 成 持续 时 间 基本 相等 的 几 步 。 每 一 步 由 不 同 的 流水 段 执行 ， 并 
且 时 钟 周期 的 选择 与 持续 时 间 最 长 的 一 步 相对 应 。 
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8.1.2 流水 线性 能 


在 图 8-2 中 ， 流 水 线 处 理 器 在 每 一 个 时 钟 周期 内 完成 一 条 指令 的 处 理 ， 这 意味 着 指令 处 理 的 
速率 是 顺序 操作 的 四 倍 。 流 水 线 所 带 来 的 性 能 的 提高 与 流水 线段 数 成 正比 。 不 过 ， 这 种 递增 只 
有 在 如 图 8-2a 所 示 的 流水 线 操作 在 整个 程序 执行 期 间 能 够 一 直 保 持 不 间断 的 情况 下 才能 获得 。 
遗憾 的 是 ， 实 际 中 并 不 是 这 样 的 。 

由 于 很 多 原因 ， 对 于 给 定 的 指令 ， 流 水 线 中 的 某 个 段 可 能 无 法 在 分 配 的 时 间 段 内 完成 它 的 
任务 。 例 如 ， 在 图 8-2b 中 4 有 段 流水 线 的 E 段 ， 它 负责 算术 和 逻辑 操作 ， 分 配 一 个 时 钟 周 期 完成 这 
项 任务 。 虽 然 对 于 大 多 数 操作 这 个 时 间 可 能 是 足够 的 ， 但 是 对 于 某 些 操作 ， 例 如 除法 ， 可 能 需 
要 较 长 的 时 间 才 能 完成 。 图 8-3 给 出 了 一 个 例子 ， 在 这 个 例子 中 指令 I 指定 的 操作 需 3 个 周期 来 完 
成 ， 即 从 第 4 个 周期 到 第 6 个 周期 。 因 此 ， 在 第 5 和 第 6 周期 ， 因 为 没有 要 处 理 的 数据 ， 所 以 写 阶 
段 不 能 做 任何 事情 。 同 时 ， 缓 冲 器 B2 中 的 信息 必须 保持 到 执行 阶段 完成 。 由 于 B1 中 的 信息 不 能 
被 覆盖 ， 所 以 第 2 段 与 第 !1 段 都 无 法 接受 新 指令 。 于 是 Ds 和 F; 必 须 如 图 所 示 的 那样 向 后 延迟 。 

图 8-3 给 出 的 流水 线 操作 抑 廷 了 两 个 时 钟 周期 。 正 常 的 流水 线 操作 在 第 7 个 周期 重新 开始 。 
任何 引起 流水 线 拖延 的 条 件 称 为 阻塞 。 前 面 我 们 看 到 的 例子 是 数据 阻 富 。 数 据 阻塞 是 指 指令 中 
的 源 或 目标 操作 数 不 能 在 流水 线 预计 的 时 间 里 获得 。 所 以 有 些 操 作 不 得 不 延迟 ， 因 此 造成 流水 
线 操作 也 被 拖延 了 。 

时 钟 周期 “1 2 3 4 5 6 7 W 
指令 





图 8-3 执行 操作 占用 多 个 时 钟 周期 的 影响 


流水 线 可 能 也 会 因为 指令 的 引用 延迟 而 被 拖延 。 例 如 ， 可 能 是 因为 高 速 缓存 失效 (未 命中 )， 
必须 从 主 存 中 提取 指令 而 造成 的 。 这 种 阻塞 一 般 叫 做 控制 险 宣 或 指令 阻塞。 流水线 操作 中 的 高 
速 缓 存 失效 的 影响 如 图 8-4 所 示 。 在 第 一 个 周期 指令 I 从 高 速 缓存 中 取出 ， 并 且 正 常 地 进行 。 然 
而 ， 在 第 二 个 周期 开始 时 指令 I 的 取 操作 出 现 了 高 速 缓存 失效 。 取 指令 部 件 现在 必须 挂 起 任何 后 
续 的 取 指 请 求 ， 等 待 的 出 现 。 假 设 指令 D 在 第 5 个 周期 末 取 到 并 装 和 人 缓冲 器 B1。 流 水 线 在 那 一 
点 重新 开始 它 的 正常 操作 。 

在 高 速 缓存 失效 的 情形 下 流水 线 操 作 的 另 一 种 表示 方法 如 图 8-4b 所 示 。 该 图 给 出 了 在 每 个 
时 钟 周期 中 每 一 段 流 水 线 实 现 的 功能 。 注 意译 码 部 件 在 第 3 个 周期 到 第 5 个 周期 处 于 空闲 状态 ， 
执行 部 件 在 第 4 个 周期 到 第 6 个 周期 是 空闲 的 ， 写 部 件 在 第 5 个 周期 到 第 7 个 周期 是 空闲 的 。 这 样 





的 空闲 称 作 拖延 。 通 常 也 称 为 流水 线 中 的 气泡 。 一 旦 在 流水 线 的 某 段 中 产生 了 延迟 ， 气 泡 就 会 
向 下 移动 直到 到 达 最 后 一 个 部 件 。 


一 > 了 时间 
8 9 


时 钟 周期 1 2 3 4 5 6 7 





D: 译 码 Di 空间 ZA EH D Ds 
E: 执行 E, ZA “H 空间 E E3 
w: 写 W, ZW ZW ZW w W3 


b) 在 连续 的 时 钟 周 期 下 处 理 器 每 段 实现 的 功能 
图 8-4 _F2 中 高 速 缓存 失效 引起 的 流水 线 延 迟 


在 流水 线 操 作 中 可 能 会 遇 到 的 第 三 类 阻塞 是 结构 阻塞 。 这 种 情形 出 现在 两 条 指令 同时 请 求 
使 用 某 个 硬件 资源 时 ， 它 经 常 在 访问 存储 器 时 发 生 。 一 条 指令 在 完成 它 的 执行 阶段 或 写 阶段 时 
可 能 需要 访问 存储 器 ， 而 此 时 正 有 另外 一 条 指令 在 完成 取 指 令 。 如 果 指 令 和 数据 位 于 同一 个 高 
速 缓存 单元 ， 那 么 只 允许 有 一 条 指令 能 够 进行 ， 另 一 条 指令 将 被 延迟 。 许 多 处 理 器 使 用 独立 的 
指令 和 数据 高 速 缓存 来 避免 这 种 延迟 。 

图 8-5 给 出 的 是 一 个 结构 阻塞 的 例子 。 该 图 说 明了 load 指 令 

Load X (R1), R2 


应 当 如 何 适 应 举例 中 的 4 段 流水 线 操作 。 存 储 器 地 址 X+[RH] 在 第 4 个 周期 的 E: 步 计算 ， 接 着 在 第 5 
个 周期 访问 存储 器 。 在 第 6 个 周期 将 从 存储 器 中 读 到 的 操作 数 写 人 到 寄存 器 R2 中 。 这 表示 指令 的 
执行 阶段 占用 两 个 时 钟 周期 (第 4 个 周期 和 第 5 个 周期 )。 它 使 流水 线 拖延 了 一 个 时 钟 周 期 ， 因 为 
指令 和 1 在 第 6 个 周期 都 要 求 访问 寄存 器 文件 。 即 使 指令 和 它 使 用 的 数据 都 已 获得 ， 流 水 线 也 
会 因为 一 个 硬件 资源 〈 例 如 寄存 器 文件 ) 不 能 同时 处 理 两 种 操作 而 产生 延迟 。 如 果 寄 存 器 文件 
有 两 个 输入 端口 ， 即 它 允 许 两 个 写 操作 同时 进行 ， 流 水 线 就 不 会 被 拖延 。 总 之 ， 通 过 在 处 理 器 
蕊 片上 提供 充足 的 硬件 资源 可 以 避免 结构 阻塞 。 

理解 流水 线 并 不 会 因为 单 指令 执行 速度 的 加 快 而 可 以 提高 吞吐 量 是 很 重要 的 。 其 中 吞吐 量 
是 通过 指令 执行 完成 的 速率 来 度量 的 。 任 何 时 候 ， 流 水 线 的 一 段 不 能 在 一 个 时 钟 周 期 完成 它 的 


+ 
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操作 ， 就 会 产生 延迟 ， 性 能 就 会 下 降 。 因 此 ， 在 一 个 时 钟 周 期 内 执行 一 条 指令 实际 上 是 图 8-2b 
所 示 的 流水 线 处 理 器 可 以 达到 的 吞吐 量 的 最 大 值 。 


— 时 间 

时 钟 周期 1 2 3 4 5 6 7 
指令 
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图 8-5 Load 指 令 对 流水 线 时 序 的 影响 


设计 处 理 器 的 一 个 重要 目标 是 识别 出 可 能 导致 流水 线 延 迟 的 所 有 阻塞 ， 并 找 出 减少 阻塞 影 
响 的 方法 。 在 随后 的 几 节 中 将 讨论 各 种 阻塞 ， 首 先是 数据 阻塞 ， 然 后 是 控制 阻塞 。 对 于 每 一 种 
情况 会 给 出 一 些 减缓 阻塞 负面 影响 的 技术 。 在 8.8 节 会 谈 到 性 能 评估 的 问题 。 


8.2 数据 阻塞 


数据 阻塞 是 操作 数据 由 于 某 种 原因 被 延迟 而 导致 流水 线 拖延 的 情况 ， 如 图 8-3 中 说 明 的 那样 。 
我 们 现在 具体 讨论 数据 可 用 性 的 问题 。 
假设 一 个 程序 包含 两 条 指令 ，L 紧 跟着 1 。 当 这 个 程序 在 流水 线 中 执行 时 ，L 可 以 在 1 的 执 
行 结束 之 前 开始 执行 。 这 意味 着 1 可 能 无 法 使 用 1 产生 的 结果 。 我 们 必须 确保 用 流水 线 处 理 器 
执行 指令 所 得 到 的 结果 与 同样 的 指令 按照 顺序 执行 所 得 到 的 结果 是 相同 的 。 下 面 通过 一 个 简 
单 的 例子 来 说 明 ， 通 过 并 行 执 行 操作 可 能 会 得 到 一 个 错误 的 结果 。 假 设 A=5， 考 虑 下 列 两 个 
操作 : 
A-3+A 
B-4xA 
当 这 两 个 操作 按照 给 定 的 顺序 执行 时 ， 结 果 是 B=32。 但 如 果 它 们 并 行 执行 ， 用 来 计算 B 的 A 值 可 
能 就 是 原 值 5， 这 样 会 导致 不 正确 的 结果 。 如 果 这 两 个 操作 是 在 同一 个 程序 的 指令 中 完成 ， 那 么 
必须 是 按 顺 序 地 执行 这 两 条 指令 。 因 为 在 第 二 条 指令 中 用 到 的 数据 依赖 于 第 一 条 指令 的 结果 。 
相反 ， 以 下 两 个 操作 
A-5xC 
B-20+C 
[61] 能 够 并 行 地 执行 。 因 为 这 两 个 操作 之 间 是 相互 独立 的 。 
本 例 说 明了 必须 施加 基本 约束 以 确保 结果 的 正确 性 。 当 两 个 操作 彼此 依赖 时 ， 必 须 以 正确 
的 次 序 顺 序 执行 。 这 种 非常 明显 的 条 件 对 结果 有 着 深远 的 影响 。 理 解 它 的 含义 是 理解 在 流水 线 





计算 机 中 碰 到 的 各 种 设计 选择 和 权衡 的 关键 。 
考虑 图 8-2 中 的 流水 线 。 以 上 描述 的 数据 依赖 性 在 当 一 条 指令 的 目标 操作 数 用 作 下 一 条 指令 
的 源 操 作 数 时 产生 。 例 如 ， 两 条 指令 
Mul R2, R3, R4 
Add R5,R4,R6 


产生 了 数据 依赖 性 。 乘 法 指令 的 结果 放 人 寄存 器 R4，R4 接 着 又 作为 加 法 指令 的 一 个 源 操作 数 。 
假设 乘法 操作 用 一 个 时 钟 周期 来 完成 ， 执 行 的 进程 如 图 8-6 所 示 。 当 译 码 部 件 在 第 3 个 周期 对 加 
法 指令 译 码 时 ， 已 了 解 到 R4 要 用 作 源 操作 数 。 因 此 ， 直 到 乘法 指令 的 W 步 完成 后 ， 加 法 指令 的 
D 步 才能 完成 。D: 步 的 完成 必须 延迟 到 第 5 个 周期 ， 在 图 中 以 Dz 步 表示 。 指 令 4 在 第 3 个 周期 获 
得 ,但 是 由 于 D; 步 不 能 在 D2 步 之 前 ， 所 以 I 的 译 码 必须 延迟 。 因 此 ,流水线 执 行 产 生 了 两 个 周期 
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8.2.1 操作 数 传递 


产生 数据 阻塞 是 因为 图 8-6 中 的 指令 等 待 将 要 写 入 到 寄存 器 文件 的 数据 。 然 而 ， 一 旦 执行 
阶段 完成 E, 步 ， 就 可 以 在 ALU 的 输出 端 获 得 这 些 数据 。 因 此 ， 如 果 我 们 安排 指令 I 的 结果 直接 传 
送 到 Eo 步 使 用 ， 则 延迟 能 够 被 缩短 或 者 可 能 被 消除 。 

图 8-7a 给 出 的 是 包含 ALU 和 寄存 器 文件 的 处 理 器 数据 通路 的 一 部 分 。 这 种 方案 除 增加 了 
SRCI、SRC2 和 RSLT 寄 存 器 以 外 ， 与 图 7-8 中 的 三 总 线 结构 相似 。 这 些 寄 存 器 构成 了 流水 线 操作 
所 需要 的 中 间 存 储 缓冲 器 ， 如 图 8-7b 所 示 。 参 看 图 8-2b， 寄 存 器 SRC1 和 SRC2 是 缓冲 器 B2 的 一 部 
分 ，RSLT 是 B3 的 一 部 分 。 数 据 传递 机 制 用 浅 色 线 标 出 。 与 ALU 输 入 端 相连 的 两 个 多 路 复 用 器 允 
许 选择 目标 总 线 上 的 数据 来 代替 SRC1 或 SRC2 寄 存 器 中 的 数据 。 

当 图 8-6 中 的 指令 在 图 8-7 中 的 数据 通路 上 执行 的 时 候 ， 在 每 一 个 时 钟 周期 实现 的 操作 如 下 。 
指令 L 译 码 后 检测 到 数据 依赖 性 ， 于 是 决定 使 用 数据 传递 。 寄 存 器 R2 中 操作 数 不 存在 数据 依赖 
性 ， 所 以 在 第 3 个 时 钟 周期 读 出 并 放 和 人 寄存 器 SRCi 中 。 在 下 一 个 时 钟 周期 ， 指 令 D 产 生 的 乘积 可 
以 在 寄存 器 RSLT 中 获得 ， 并 且 由 于 是 传递 连接 ， 这 个 乘积 可 在 E: 步 使 用 。 因 此 ，L 将 正常 执行 
而 不 会 被 中 断 。 
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W: 
(寄存 器 文件 ) 


与 





b) 处 理 器 流水 线 中 源 寄存 器 和 目标 寄存 器 的 位 置 
图 8-7 流水 线 处 理 器 中 的 操作 数 传递 


8.2.2 用 软件 方法 处 理 数据 阻塞 


在 图 8-6 中 ， 我 们 假设 数据 依赖 性 是 由 硬件 在 指令 译 码 过 程 中 检测 到 的 。 控 制 硬件 延迟 到 第 

5 个 周期 才 读 寄存 器 R4， 这 样 除非 使 用 操作 数 传递 ， 否 则 将 引入 两 周期 的 延 时 。 另 一 种 可 选择 的 
方法 是 将 检测 数据 依赖 性 的 任务 留 给 软件 处 理 。 在 这 种 情况 下 ， 编 译 程序 可 以 插入 NOP (无 操 
fE) 指令 在 指令 5 和 之 间 产 生 所 需要 的 两 个 周期 的 延 时 ， 例 如 

L: Mul R2, R3, R4 

NOP 

NOP 

D: Add R5, R4, R6 
如 果 检 测 这 种 依赖 性 的 任务 完全 留 给 软件 ， 那 么 编译 程序 必须 能 够 插入 NOP 指 令 以 获得 正确 结 
果 。 这 种 可 能 性 说 明了 编译 程序 和 硬件 之 间 的 紧密 联系 。 某 些 特殊 的 性 能 可 以 由 硬件 实现 ， 也 
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可 以 留 给 编译 程序 来 实现 。 将 插入 NOP 指令 的 任务 留 给 编译 程序 完成 会 使 硬件 更 加 简化 。 如 果 
认为 需要 这 种 延迟 ， 编 译 程序 可 以 尝试 着 对 指令 重新 排序 以 便 在 NOP 时 间 段 执行 其 他 有 用 的 任 
务 ， 从 而 获得 较 好 性 能 。 另 一 方面 ，NOP 指 令 的 插入 使 得 代码 长 度 增加 。 而 且 经 常会 出 现 这 种 
情形 ， 一 个 给 定 的 处 理 器 体系 结构 具有 多 种 硬件 实现 方法 ,不同 的 实现 方法 提供 不 同 的 特性 。 
为 了 满足 一 种 实现 的 需要 而 插入 的 NOP 指 令 可 能 对 另 一 种 不 同 实现 方法 并 不 合适 ， 从 而 会 导致 
性 能 降低 。 


8.23 副作用 


在 前 面 例子 中 遇 到 的 数据 依赖 性 很 明显 并 且 很 容易 检测 到 ， 因 为 涉及 到 的 寄存 器 在 指令 1 中 
作为 目标 寄存 器 ， 而 在 5 中 作为 源 寄存 器 。 有 时 候 指 令 还 会 修改 其 他 寄存 器 的 内 容 ， 而 不 仅仅 是 
修改 目标 寄存 器 。 使 用 自动 递增 或 自动 递减 寻 址 方式 的 指令 就 是 这 样 的 一 个 例子 。 它 除了 在 目 
标 单元 存储 新 数据 ， 指 令 还 修改 了 用 于 访问 指令 的 一 个 操作 数 的 源 寄存 器 的 内 容 。 用 于 处 理 涉 
及 目标 单元 的 数据 依赖 性 的 所 有 预防 措施 ， 必 须 也 要 适用 于 受 自动 递增 或 自动 递减 操 作 所 影响 
到 的 寄存 器 。 除 了 在 指令 中 明确 指明 的 目标 操作 数 单元 以 外 ， 其 他 的 单元 也 受到 了 影响 时 ， 就 
称 该 指令 有 副作用 。 例 如 像 push 和 pop 这 种 堆栈 指令 就 产生 类 似 的 副作用 ， 因 为 它们 隐 含 地 使 用 
自动 递增 和 自动 递减 寻 址 方式 。 

另 一 种 产生 副作用 的 可 能 性 是 条 件 码 标志 ， 它 被 诸如 条 件 转移 和 带 进位 的 加 法 等 指令 所 使 
用 。 假 设 在 寄存 器 R1 和 R2 中 存 有 一 个 双 精 度 整数 ， 我 们 希望 将 它 与 在 寄存 器 R3 和 R4 中 的 另 一 个 
双 精 度数 相 加 。 可 能 按 以 下 方式 实现 : 

Add RI,R3 
AddWithCarry R2, R4 
这 两 条 指令 通过 进位 标志 存在 着 隐 含 的 依赖 性 。 进 位 标志 由 第 一 条 指令 设置 并 被 用 于 第 一 条 指 
令 中 ， 它 执行 的 操作 是 
R4 一 [R2]+[R4]+ 进 位 

有 副作用 的 指令 会 产生 大 量 数据 依赖 性 ， 导 致 用 来 解决 数据 依赖 性 的 硬件 或 软件 的 复杂 度 
大 大 提高 。 由 于 这 种 原因 ， 设 计 在 流水 线 硬件 上 执行 的 指令 应 该 很 少 有 副作用 。 理 想 情 况 是 ， 
只 有 那些 在 寄存 器 或 存储 单元 中 的 目标 单元 内 容 会 受到 给 定 指令 的 影响 。 应 该 将 诸如 设置 条 件 
码 标志 或 者 更 新 地 址 指针 内 容 等 副作用 降 到 最 低 。 然 而 ， 在 第 2 章 给 出 的 自动 递增 和 自动 递减 寻 
址 方式 是 很 有 用 的 ， 条 件 码 标志 也 需要 在 算术 运算 中 记录 产生 的 进位 或 溢出 等 信息 。 在 8.4 节 中 
我 们 会 指出 这 些 功能 如 何 由 符合 流水 线 结构 和 优化 编译 器 要 求 的 其 他 方式 提供 。 


8.3 指令 阻塞 


取 指 令 部 件 的 目标 是 为 执行 部 件 提供 一 个 平稳 的 指令 流 ， 无 论 何 时 指令 流 中 断 ， 流 水 线 就 
会 出 现 延迟 ， 就 像 在 图 8-4 中 说 明 的 高 速 缓存 失效 的 情形 。 转 移 指令 也 可 能 会 引起 流水 线 的 延迟 。 
现在 来 看 看 转移 指令 的 影响 以 及 用 来 减缓 转移 指令 影响 的 技术 。 我 们 先 从 无 条 件 转移 开始 。 


8.3.1 无 条 件 转移 
图 8-8 给 出 的 是 正在 一 个 2 段 流 水 线 上 执行 的 指令 序列 。 指 令 0 到 HB 存 储 在 地 址 连续 的 存储 单 
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元 中 ，D 是 转移 指令 。 其 转移 目标 是 指令 K。 在 第 3 个 时 钟 周 期 取 指 令 5， 同 时 ， 对 转移 指令 进行 
译 码 并 计算 目标 地 址 。 在 第 4 个 时 钟 周 期 ， 处 理 器 丢弃 已 经 取出 且 不 正确 的 B， 并 取出 指令 KK。 同 
时 通知 负责 执行 (E) 步 又 的 硬 部 件 在 那个 时 钟 周 期 什么 都 不 要 做 ， 从 而 使 流水 线 延 迟 一 个 时 钟 
周期 。 

由 于 转移 指令 而 浪费 的 时 间 一 般 叫 做 转移 代价 。 在 图 8-8 中 ， 转 移 代 价 是 一 个 时 钟 周 期 。 对 
于 较 长 的 流水 线 ， 转 移 代 价 可 能 会 更 高 。 例 如 ， 图 8-9a 是 转移 指令 在 一 个 4 段 流水 线 上 执行 的 效 
果 。 假 设 转移 地 址 在 Es 步 计算 ， 在 第 5 个 时 钟 周期 必须 将 指令 I 和 LL 丢弃 同时 取出 目标 指令 Lk.。 因 
此 ， 转 移 代价 是 两 个 时 钟 周期 。 

为 了 减少 转移 代价 ， 应 该 在 流水 线 中 较 早 地 计算 出 转移 地 址 。 典 型 地 ， 在 取 指 令 后 ， 取 指 
令 部 件 指示 硬件 识别 转移 指令 并 且 尽 可 能 快 地 计算 出 转移 目标 地 址 。 有 了 这 个 额外 硬件 ， 两 个 
任务 在 D; 步 都 能 执行 。 事 件 的 发 生活 序 如 图 8-9b 所 示 。 在 这 种 情形 下 ， 转 移 代 价 仅仅 是 一 个 时 
钟 周期 。 


— 时 间 
6 


图 8-8 由 转移 指令 产生 的 一 个 空闲 周期 


指令 队列 和 预 取 操作 

高 速 缓存 失效 或 转移 指令 会 使 流水 线 延 迟 一 个 或 多 个 时 钟 周 期 。 为 了 减少 这 些 中 断 的 影响 ， 
许多 处 理 器 采用 复杂 的 取 指 令 部 件 。 这 种 取 指令 部 件 能 够 在 指令 使 用 前 将 指令 取出 并 把 它们 放 
在 一 个 队列 中 。 通 常 ， 指 令 队 列 能 够 存储 多 条 指令 。 一 个 称 为 调度 单元 的 独立 部 件 从 队列 前 面 
取出 指令 并 送 到 执行 部 件 中 。 这 样 的 硬件 结构 如 图 8-10 所 示 。 调 度 单元 也 执行 译 码 功能 。 

为 了 有 效 ， 取 指令 部 件 必 须 有 充足 的 译 码 和 处 理 能 力 来 识别 和 执行 转移 指令 。 它 尽量 保持 
指令 队列 总 是 满 的 ， 以 降低 取 指 令 时 的 偶然 延迟 所 产生 的 影响 。 例 如 ， 当 由 于 数据 阻塞 而 带 来 
流水 线 延迟 时 ， 调 度 部 件 不 能 发 送 从 指令 队列 中 取出 的 指令 。 然 而 ， 取 指令 部 件 继续 取 指令 并 
把 它们 加 入 队列 中 。 相 反 ， 如 果 由 于 转移 指令 或 高 速 缓存 失效 而 使 得 取 指 令 时 存在 延迟 ， 调 度 
部 件 会 继续 发 送 从 指令 队列 中 取出 的 指令 。 

图 8-11 说 明了 队列 长 度 如 何 改变 以 及 它 如 何 影响 不 同 流水 线 阶段 之 间 的 关系 。 假 设 初始 队 
列 中 包含 有 一 条 指令 ， 每 一 个 取 操作 在 队列 中 增加 一 条 指令 ， 每 次 调度 操作 使 队列 长 度 减 1。 因 
此 ， 在 前 4 个 时 钟 周 期 中 ， 队 列 长 度 保持 不 变 。( 在 每 一 个 周期 中 都 有 步骤 F 和 步骤 D。) 假设 指 
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令 01 产 生 了 两 周期 的 延迟 。 因 为 队列 中 有 空间 ， 所 以 取 指 令 部 件 继续 取 指令 ， 在 第 6 个 时 钟 周 期 
队列 长 度 增 至 3。 





— 时 间 
6 7 8 

' DOAA 

a) 转移 地 址 在 执行 阶段 计算 
时 钟 周期 1 2 3 4 5 6 m 
n Im n] |w 
b (#5) 
k P (a {5 Lw 

b) 转移 地 址 在 译 码 阶段 计算 

图 8-9 转移 时 序 





图 8-10 在 图 8-2b 的 硬件 结构 中 使 用 一 个 指令 队列 


指令 Is 是 一 条 转移 指令 。 在 第 7 个 周期 取 它 的 目标 指令 I 并 丢弃 指令 I6。 在 第 7 个 周期 ， 由 于 
丢弃 了 指令 s， 转 移 指令 会 引起 延迟 。 相 反 ， 指 令 L 从 队列 调度 到 译 码 段 。 丢 弃 Is 后 ， 在 第 8 个 周 
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期 队列 的 长 度 降 至 1。 队 列 长 度 会 保持 此 值 直到 遇 到 另 一 个 延迟 。 

现在 看 看 在 图 8-11 中 指令 执行 的 上 顺序。 指令、E、E、L 和 L 在 连续 的 时 钟 周期 完成 执行 。 
因此 ， 转 移 指令 并 不 增加 总 的 执行 时 间 。 这 是 因为 取 指 令 部 件 在 执行 其 他 指令 的 同时 执行 了 转 
移 指令 〈 通 过 计算 转移 地 址 )。 这 种 技术 称 为 转移 重 登 。 


— = 时 间 
了 时钟 周期 1 2 3 4 5 6 7 8 9 10 
队列 长 度 1 1 1 1 2 3 2 1 l 1 
' BnL 
r eel Ee 
N S] ee 
N I EET] 
s (8888) [= [°: ] 
k [e 
7 In Te TS 
lesi (Fon [Pe Em] 


图 8-11 存在 于 一 个 指令 队列 中 的 转移 时 序 ; 转移 目标 地 址 在 D 段 计算 


注意 转移 重 又 只 有 在 遇 到 转移 指令 且 队 列 中 除了 转移 指令 还 有 至 少 一 条 指令 的 情况 下 才 会 
发 生 。 如 果 队 列 中 只 有 转移 指令 ， 那 么 执行 过 程 就 会 如 图 8-9b 所 示 的 那样 。 因 此 ， 为 了 确保 为 
处 理 过 程 提供 足够 的 指令 ， 大 多 数 时 间 应 该 安排 队列 是 满 的 。 这 可 以 通过 提高 取 指 令 部 件 从 高 
速 缓存 读 人 指令 的 速率 来 实现 。 在 许多 处 理 器 中 ， 取 指令 部 件 和 指令 高 速 缓存 之 间 的 连接 带 寅 
人 允许 在 每 一 个 时 钟 周期 读 人 多 条 指令 。 如 果 出 现 转移 ， 取 指令 部 件 迅 速 补充 指令 队列 ， 那 么 转 
移 重 但 出 现 的 概率 就 会 提高 。 

增加 指令 队列 在 处 理 高 速 缓 存 失效 时 也 是 有 益 的 。 当 发 生 高 速 缓存 失效 时 ， 只 要 指令 队列 
不 至 ， 调 度 部 件 就 会 继续 为 执行 部 件 传送 指令 。 同 时 ， 从 主 存 或 二 级 高 速 缓存 中 读 入 想 要 的 高 
速 缓存 块 。 当 取 操 作 重 新 开始 时 ， 就 会 再 填 满 指令 队列 。 如 果 队 列 没有 变 空 ， 那 么 高 速 缓 存 失 
效 对 指令 执行 的 速率 就 不 会 有 影响 。 

总 之 ， 通 过 转移 重 登 过 程 指令 队列 减缓 了 转移 指令 对 性 能 的 影响 。 它 与 高 速 缓存 失效 引起 
的 延迟 效果 相似 。 当 取 指 令 部 件 一 次 能 从 指令 高 速 缓存 读 入 多 条 指令 时 ， 该 技术 的 效果 会 更 好 。 


8.3.2 条 件 转移 和 转移 预测 


转移 条 件 与 上 一 条 指令 结果 的 依赖 性 使 得 条 件 转移 指令 产生 了 新 增 阻塞 的 可 能 性 。 直 到 相 
关 指 令 执行 结束 ， 才 可 以 做 出 转移 决策 。 

转移 指令 会 经 常 出 现 。 实 际 上， 转移 指令 大 约 占 大 多 数 程 序 动态 指令 数 的 20% (动态 数 是 
指令 执行 的 数量 ， 考 虑 到 有 些 程序 指令 由 于 循环 而 执行 很 多 次 的 情况 )。 由 于 转移 代价 ， 这 个 大 





的 百分比 会 降低 采用 流水 线 技术 所 带 来 的 性 能 提高 。 幸 运 的 是 ， 可 以 采用 多 种 方法 来 处 理 转 移 
指令 以 降低 它们 对 指令 执行 速率 的 负面 影响 。 

延迟 转移 

在 图 8-8 中 ， 处 理 器 在 确定 当前 指令 ,是否 是 转移 指令 前 就 取出 了 指令 Is。 当 了 ,执行 结束 并 且 
出 现 转移 时 ， 处 理 器 必须 丢弃 DB 并 取 转 移 目 标 处 的 指令 。 跟 在 转移 指令 后 面 的 单元 叫做 转移 延迟 
槽 。 根 据 执 行 转 移 指令 所 用 的 时 间 ， 可 能 存在 多 个 转移 延迟 槽 。 例 如 ， 在 图 8-9a 中 有 两 个 转移 
延迟 梢 ， 在 图 8-9b 中 有 一 个 。 在 延迟 槽 中 的 指令 通常 在 确定 转移 和 转移 目标 地 址 被 计算 出 来 之 
前 已 经 被 取出 ， 并 且 至 少 已 经 有 一 部 分 被 执行 了 。 

延迟 转移 技术 可 以 减 小 由 于 条 件 转移 指令 而 带 来 的 时 间 代 价 。 这 种 想法 很 简单 ， 在 延迟 模 
中 的 指令 通常 是 可 以 被 提取 的 。 因 此 ， 无 论 转移 是 否 发 生 ， 我 们 希望 对 它们 进行 完全 的 执行 。 
目的 是 能 够 在 这 些 槽 中 放 入 有 用 指令 。 如 果 在 延迟 槽 中 
没有 放 入 有 用 的 指令 ， 这 些 槽 必须 用 NOP 指 令 填 满 。 这 


Shift left 
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种 情形 与 在 8.2 节 讨论 的 数据 依赖 性 情形 完全 相同 。 Ah 0 
考虑 在 图 8-12a 中 给 出 的 指令 序列 。 寄 存 器 R2 当 作 

计数 器 ， 它 决定 寄存 器 RI 的 内 容 左 移 的 次 数 。 对 于 有 一 a) 原始 循环 程序 

个 延迟 槽 的 处 理 器 ， 指 令 能 够 如 图 8-12b 所 示 重 新 排序 。 

在 转移 指令 执行 的 同时 读 取 移 位 指令 。 判断 转移 条 件 后 ， Decrement 

处 理 器 根据 转移 条 件 是 真 还 是 假 来 读 取 LOOP 或 NEXT Bn 

处 的 指令 。 在 任何 一 种 情形 下 ， 它 都 执行 了 移 位 指令 。 Add 

在 循环 的 后 两 步 ， 事 件 的 顺序 如 图 8-13 所 示 。 在 任何 时 o RAKOA 

刻 ， 流 水 线 操 作 没 有 被 中 断 ， 并 且 不 存在 空闲 周期 。 晃 


辑 上 ， 程 序 执行 就 像 转移 指令 放 在 移 位 指令 之 后 一 样 。 ”图 8 12 用 于 延迟 转移 的 指令 重新 排序 
也 就 是 说 ， 与 转移 指令 在 存储 器 中 的 指令 顺序 相 比 ， 要 晚 一 条 指令 才 会 发 生 转 移 ， 因 此 称 为 
“延迟 转移 "。 

延迟 转移 方法 的 有 效 性 取决 于 如 图 8-12 所 示 的 重 排 指令 的 频率 。 从 许多 程序 搜集 到 的 实验 
数据 证 明 ， 在 85% 的 情形 下 复杂 的 编译 技术 可 以 使 用 一 个 转移 延迟 档 。 对 于 拥有 两 个 转移 延迟 
槽 的 处 理 器 ， 编 译 程序 尽力 找 出 转移 指令 之 前 的 两 条 指令 ， 它 将 其 移入 延迟 模 而 不 会 产 生 逻辑 
错误 。 找 到 两 条 这 样 指令 的 几率 远 远 小 于 找到 一 条 的 几率 。 因 此 ， 如 果 增 加 一 个 用 来 增加 转移 
延迟 档 数 量 的 流水 线 阶段 ， 那 么 在 性 能 方面 的 收获 或 许 不 能 完全 体现 出 来 。 

转移 预测 

降低 与 条 件 转移 相关 的 转移 代价 的 另 一 种 技术 是 尽力 预测 出 某 个 特定 的 转移 是 否 会 执行。 
转移 预测 的 最 简单 形式 是 假设 不 会 发 生 转移 ， 继 续 以 连续 地 址 顺序 取 指令 。 直 到 转移 条 件 被 关 
定时 ， 指 令 沿 着 预计 路 径 的 执行 一 定 是 在 推测 的 基础 上 做 出 的 。 推 测 执行 意味 着 指令 在 处 理 器 
确定 它们 的 正确 执行 顺序 之 前 已 经 开始 执行 。 因 此 ， 必 须 注意 直到 可 以 确定 这 些 指令 的 确 应 该 
执行 后 ， 处 理 器 寄存 器 或 存储 器 单元 才能 更 新 。 如 果 转 移 决策 指明 的 是 另 一 种 情况 ， 那 么 执行 
部 件 中 的 指令 和 相关 数据 必须 清除 ， 并 取出 正确 指令 来 执行 。 

图 8-14 所 示 的 是 4 段 流水 线 的 一 种 不 正确 的 预测 转移 。 该 图 表示 在 一 条 比较 指令 后 面 跟着 
条 Branch>0 指 令 。 转 移 预测 在 第 3 个 周期 发 生 ， 同 时 取 指令 I。 取 指令 部 件 预测 转移 不 会 发 生 ， 
当 I 进 入 译 码 段 时 继续 取 指令 I。 在 第 3 个 周期 末 得 到 比较 操作 的 结果 。 假 设 比 较 操 作 的 结果 立 
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即 传送 给 取 指 部 件 ， 在 第 4 个 周期 判断 转移 条 件 。 此 处 ， 取 指令 部 件 意识 到 预测 不 正确 ， 并 清除 
执行 流水 线 中 的 两 条 指令 。 在 第 5 个 时 钟 周期 从 转移 目标 地 址 处 取出 新 的 指令 I。 
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图 8-13 执行 时 序 表 明 在 图 8-12b 中 的 最 后 两 个 步骤 中 通过 循环 填 满 延迟 模 
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图 8-14 当 转 移 决策 与 预测 不 相符 时 的 时 序 


如 果 转 移出 口 是 随 机 的 ， 那 么 有 一 半 的 转移 会 被 捕获 到 。 假 设 不 发 生 转 移 的 简单 方法 可 节 
省 条 件 转移 所 浪费 时 间 的 50%。 然 而 ， 如 果 根 据 预 期 程序 的 行为 ， 预 测 某 些 转移 指令 会 发 生 ， 
而 另 一 些 不 会 发 生 ， 这 样 就 可 以 获得 较 好 的 性 能 。 例 如 ， 循 环 末尾 的 转移 指令 导致 在 整个 循环 
期 间 除 了 最 后 一 步 外 ， 每 一 步 都 可 使 转移 回 到 循环 的 开始 。 因 此 ， 假 设 这 个 转移 会 发 生 ， 并 且 
让 取 指 部 件 开始 读 取 转 移 目 标 地 址 处 的 指令 是 有 利 的 。 相 反 ， 对 于 程序 循环 开始 处 的 转移 指令 
假设 转移 不 会 发 生 是 比较 有 利 的 。 

预测 转移 的 结果 ， 可 以 用 观察 转移 目标 地 址 比 转移 指令 的 地 址 低 还 是 高 的 方法 用 硬件 来 实 





现 。 一 种 比较 灵活 的 方法 是 由 编译 程序 决定 给 出 的 转移 指令 应 该 预测 为 发 生还 是 不 发 生 。 在 一 
些 处 理 器 的 转移 指令 中 ， 例 如 SPARC， 包 括 有 转移 预测 位 ， 通 过 编译 程序 对 它 置 为 0 或 1 来 表示 
所 需要 的 行为 是 什么 。 取 指令 部 件 检 查 这 个 位 来 预测 转移 是 否 会 发 生 。 

无 论 采 用 哪 种 策略 ， 对 于 某 个 具体 指令 每 次 执行 时 转移 预测 决策 通常 是 相同 的 。 具 有 这 种 
特征 的 任何 方法 都 叫做 静态 转移 预测 。 另 一 种 方法 叫做 动态 转移 预测 。 在 动态 预测 方法 中 ， 预 
测 的 决策 可 能 会 根据 执行 过 程 而 改变 。 

动态 转移 预测 

转移 预测 算法 的 目标 是 减少 作出 错误 决策 的 概率 、 训 免 取 出 那些 最 后 不 得 不 丢弃 的 指令 。 在 
动态 转移 预测 方案 中 ， 人 处理 器 硬件 通过 跟踪 每 次 指令 执行 的 结果 来 判断 特定 转移 发 生 的 可 能 性 。 

最 简单 形式 是 用 给 定 转移 指令 出 口 的 执行 历史 作为 这 条 指令 最 近 执 行 的 结果 。 处 理 器 假设 
下 一 次 指令 执行 时 ， 其 结果 可 能 是 相同 的 。 因此， 算法 可 以 用 图 8-15a 中 的 2 状态 机 来 描述 。 这 
两 个 状态 是 : 


发 生 转 移 (BT) 
LT: 可 能 发 生 转移 
LNT 可 能 不 发 生 转 移 pe 1O Op u 
假设 算法 从 状态 LNT 开 始 。 当 转移 指令 执行 时 ， 
如 果 发 生 转移 ， 状 态 机 移 到 状态 LT。 否则， 保持 在 KRENE (ENT) 
状态 LNT 上 。 下 一 次 遇 到 相同 指令 时 ， 如 果 相 应 的 
状态 机 在 状态 LT， 预 测 为 会 发 生 转移 ， 否 则 预测 为 DRE 
不 发 生 转 移 。 


这 种 简单 的 方案 在 循环 程序 内 部 会 很 好 地 运行 ， 
它 要 求 每 一 条 转移 指令 要 有 一 位 历史 信息 位 。 一 旦 
进入 循环 ， 控 制 循环 的 转移 指令 总 是 会 产生 相同 的 
结果 直至 整个 循环 的 最 后 一 步 。 在 最 后 一 步 ， 转 移 
预测 会 转向 一 个 错误 处 ， 并 且 转 移 历史 状态 机 也 会 
改变 到 相反 的 状态 上 。 假 设 存在 多 遍 循环 ， 则 下 一 
次 进入 同样 的 循环 时 ， 状 态 机 会 产生 错误 预测 。 

对 执行 历史 保留 更 多 信息 可 以 获得 较 好 的 性 能 。 
采用 4 状态 算法 ， 每 一 条 转移 指令 需要 两 个 历史 信息 
位 ， 如 图 8-15b 所 示 。 这 4 个 状态 是 : 





ST: 极 有 可 能 发 生 

LT. 有 可 能 发 生 

LNT: 不 可 能 发 生 7 
SNT: 极 不 可 能 发 生 图 8-15 转移 预测 算法 的 状态 机 表示 


假设 算法 的 初始 状态 设置 为 LNT。 执 行 转移 指令 后 ， 如 果 确 实 发 生 转 移 ， 那 么 状态 变化 到 ST; 
否则 ， 变 化 到 SNT。 随 着 程序 的 执行 ， 再 一 次 遇 到 同样 的 指令 时 ， 转 移 预 测算 法 的 状态 继续 如 
图 所 示 发 生变 化 。 当 遇 到 转移 指令 时 ， 如 果 状 态 是 LT 或 ST， 那 么 取 指 部 件 预 测 会 发 生 转 移 ， 并 
开始 取 转 移 目 标 地 址 处 的 指令 。 否 则 ， 继 续 取 连 续 地 址 处 的 指令 。 

了 解 转移 预测 算法 的 具体 行为 是 有 意义 的 。 当 处 于 状态 SNT 时 ， 取 指 部 件 预测 不 会 发 生 转 
B. 如果 实际 上 发 生 了 转移 ， 即 如 果 预 测 不 正确 ， 那 么 状态 变化 到 LNT。 这 意味 着 下 一 次 遇 到 
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相同 转移 指令 时 ， 取 指 部 件 将 会 预测 不 发 生 转 移 。 只 有 在 一 行 中 两 次 预测 不 正确 时 状态 才 会 变 
化 到 ST。 从 那 以 后 ， 预 测 为 会 发 生 转 移 。 

我 们 再 考虑 一 下 当 执 行 循环 程序 时 所 发 生 的 情况 。 假 设 转移 指令 位 于 循环 末尾 并 且 处 理 器 
设置 算法 的 初始 状态 为 LNT。 在 循环 的 第 一 遍 ， 预 测 将 是 错误 的 (不 发 生 转 移 )， 从 而 状态 会 变 
化 到 ST。 在 后 续 的 所 有 循环 中 ， 除 了 最 后 一 遍 ， 预 测 都 将 是 正确 的 。 那 时 ， 状 态 会 变化 到 LT。 
当 再 一 次 进入 循环 时 ， 预 测 会 是 正确 的 (发 生 转 移 )。 

现在 进行 最 后 一 次 修改 以 更 正 首次 进入 循环 时 的 错误 转移 预测 。 在 这 种 情形 下 预测 错误 的 
原因 是 转移 预测 算法 的 初始 状态 。 由 于 缺少 转移 指令 属性 的 附加 信息 ， 我 们 假设 处 理 器 设置 的 
初始 状态 为 LNT。 所 需要 的 设置 初始 状态 的 正确 信息 可 以 由 前 面 讨论 的 任何 一 种 静态 预测 方案 
提供 。 处 理 器 可 以 通过 比较 地 址 或 者 通过 检查 指令 中 的 预测 位 ， 来 设置 算法 的 初始 状态 为 LNT 
或 CT。 在 循环 末 发 生 转移 时 ， 编 译 程序 会 指出 转移 应 被 预测 为 会 发 生 转 移 ， 将 初始 状态 设置 为 
LT。 有 了 这 个 修改 ， 除 了 整个 循环 的 最 后 一 步 外 ， 转 移 预 而 通常 会 是 正确 的 。 而 后 一 种 错误 预 
测 的 情况 是 不 可 避免 的 。 

处 理 器 可 以 采用 多 种 方法 来 保留 用 于 动态 转移 预测 算法 的 状态 信息 。 它 们 可 以 被 记录 在 一 
张 查询 表 中 ， 由 转移 指令 地 址 的 低位 部 分 存 取 。 在 这 种 情形 下 ， 可 能 会 有 两 条 转移 指令 共享 同 
一 个 表 的 入 口 。 这 可 能 导致 转移 预测 错误 ， 但 是 它 不 会 导致 执行 错误 。 错 误 预 测 只 会 引入 执行 
时 间 的 小 延迟 。 一 种 替换 的 方法 是 在 指令 高 速 缓存 中 存储 与 转移 指令 相关 的 历史 信息 位 作为 标 
签 。 在 8.7 节 我 们 会 看 到 在 SPARC 处 理 器 中 这 条 信息 是 如 何 处 理 的 。 


8.4 对 指令 集 的 影响 


我 们 已 经 了 解 到 有 一 些 指令 比较 适合 于 流水 线 执行 ， 而 另 一 些 则 不 适合 。 比 如 ， 指 令 副 作 
用 可 能 会 产生 不 希望 的 数据 依赖 性 。 在 本 节 来 了 解 流水 线 执行 和 机 器 指令 特性 之 间 的 关系 。 我 
们 讨论 机 器 指令 的 两 个 关键 方面 一 - 寻 址 方式 和 条 件 码 标志 。 


8.4.1 导 址 方式 


寻 址 方式 应 该 提供 简单 有 效 的 存 取 各 种 数据 结构 的 方式 。 比 较 常 用 的 寻 址 方式 包括 变 址 寻 
址 、 间 接 寻 址 、 自 动 递增 寻 址 和 自动 递减 寻 址 。 许 多 处 理 器 提供 这 些 方式 的 各 种 组 合 以 增加 它 
们 指令 集 的 灵活 性 。 复 合 寻 址 方式 经 常会 遇 到 ， 比 如 那些 涉及 双 变 址 的 方式 。 

选择 在 流水 线 处 理 器 中 实现 的 寻 址 方式 时 ， 我 们 必须 考虑 每 一 种 寻 址 方式 对 流水 线 指令 流 
的 影响 。 这 方面 要 考虑 的 两 个 重要 内 容 是 : 自动 递增 录 址 和 自动 递 碱 寻 址 方式 的 副作用 以 及 复 
合 寻 址 方式 引起 的 流水 线 拖延 的 程度 ， 另 一 个 重要 因素 是 编译 程序 是 否 能 利用 给 定 的 寻 址 方式 。 

为 了 比较 各 种 方法 ， 我 们 假定 一 种 用 于 访问 存储 器 中 操作 数 的 简单 模型 。 取 指令 Load X 
(R1), R2 用 5 个 周期 完成 它 的 执行 ， 如 图 8-5 所 示 。 然 而 ， 指 令 

Load (RD,R2 . ` 
由 于 不 需要 计算 地 址 ， 从 而 可 以 构成 适应 于 4 阶段 流水 线 的 方式 。 对 存储 器 的 访问 可 在 E 段 发 生 。 
比较 复杂 的 寻 址 方式 可 能 需要 多 次 访问 存储 器 来 获得 所 需要 的 操作 数 。 例 如 ， 指 令 
Load (X ( R1 }), R2 
可 能 会 如 图 8-16a 所 示 那 样 执行 ， 这 里 假设 变 址 偏 移 量 X 在 指令 字 中 给 出 。 在 第 3 个 周期 完成 计算 
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地 址 后 ， 处 理 器 需要 两 次 访问 存储 器 一 一 第 一 次 在 第 4 个 时 钟 周期 读 单元 X+[R1]， 接 着 在 第 5 个 
周期 读 单 元 [X+[R1]]。 如 果 R2 是 下 一 条 指令 中 的 源 操作 数 ， 那 么 下 条 指令 将 会 延迟 3 个 周期 ， 用 
操作 数 传递 可 缩短 到 2 个 周期 ， 如 图 所 示 。 


一 -时间 
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时 钟 周期 2 3 4 5 6 





b) 简单 寻 址 方式 
图 8-16 采用 复合 和 简单 寻 址 方式 的 等 效 操作 


如 果 只 使 用 简单 寻 址 方式 来 实现 同样 的 Load 操 作 ， 就 需要 多 条 指令 。 例 如 ， 在 允许 三 操作 

数 地 址 的 计算 机 中 ， 我 们 可 用 

Add #X,R1,R2 

Load (R2), R2 

Load (R2), R2 
Add 指 令 执 行 操作 R2 ~X+[R1]。 这 两 条 取 指令 先后 从 存储 器 中 取 地 址 和 操作 数 。 这 个 指令 序列 
正好 与 最 初 的 单条 到 指令 使 用 的 时 钟 周期 数 相 同 ， 如 图 8-16b 所 示 。 

这 个 例子 表明 ， 在 流水 线 处 理 器 中 ， 涉 及 多 次 访问 存储 器 的 复合 寻 址 方式 不 一 定 会 提高 执 
行 速 度 。 此 类 方式 的 主要 优点 是 减少 了 执行 给 定 任务 所 需要 的 指令 数量 ， 从 而 减少 了 在 主 存储 
器 中 所 需要 的 程序 空间 。 主 要 缺点 是 执行 时 间 长 ， 造 成 流水 线 拖延 ， 从 而 降低 流水 线 的 效率 。 
复合 寻 址 方式 需要 用 较 复杂 的 硬件 进行 译 码 和 执行 。 而 且 ， 复 合 寻 址 方式 也 不 利于 编译 程序 的 
工作 。 

现代 处 理 器 的 指令 集 通常 设计 成 最 大 限度 利用 流水 线 优势 的 硬件 。 因 为 复合 寻 址 方式 不 适 
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应 于 流水 线 的 执行 ， 所 以 应 该 避免 。 用 于 现代 处 理 器 的 寻 址 方式 一 般 具 有 下 列 特征 : 

“ 存 取 操 作 数 要 求 访问 存储 器 最 多 一 次 。 

` 只 有 取 和 存 指令 可 以 访问 内 存 操作 数 。 

。 采 用 的 寻 址 方式 没有 副作用 。 
具有 这 些 特征 的 三 种 基本 寻 址 方式 是 寄存 器 寻 址 、 寄 存 器 间接 寻 址 和 变 址 寻 址 。 前 两 种 不 需要 
地 址 计算 。 变 址 寻 址 方式 的 地 址 可 在 一 个 周期 中 计算 出 来 ， 无 论 变 址 值 是 在 指令 中 给 出 还 是 在 
寄存 器 中 给 出 。 存 储 器 的 访问 在 随后 的 一 个 周期 中 进行 。 这 三 种 方式 不 能 有 任何 的 副作用 和 任 
何 一 种 可 能 的 异常 。 有 一 些 体系 结构 ， 例 如 ARM， 人 允许 变 址 方式 下 计算 出 的 地 址 写 回 到 变 址 寄 
存 器 中 。 这 是 在 上 面 的 指导 思想 下 不 允许 有 的 副作用 。 而 生还 要 注意 可 能 会 用 到 相对 寻 址 ， 这 
是 变 址 寻 址 中 的 一 种 特殊 情况 。 在 这 种 方式 下 程序 计数 器 当 作 变 址 寄存 器 。 

这 里 列 出 的 3 个 特征 第 一 次 作为 RISC 处 理 器 概念 中 的 一 部 分 被 提出 。SPARC 处 理 器 体系 结 
构 遵循 这 些 特 征 ， 这 些 将 在 8.7 节 中 介绍 。 


8.4.2 条 件 码 


就 像 在 第 3 章 中 描述 的 那样 。 在 许多 处 理 器 中 条 件 码 标志 存储 在 处 理 器 的 状态 寄存 器 中 。 它 
们 可 以 被 许多 指令 设置 或 者 清除 ， 以 便 由 后 续 的 条 件 转 移 指 令 来 测试 从 而 改变 程序 执行 的 流程 。 
流水 线 处 理 器 的 优化 编译 器 试 着 对 指令 重新 排序 ， 以 避免 当 连 续 指 令 之 间 出 现 转移 或 数据 依赖 
性 时 使 流水 线 出 现 延 迟 。 在 实现 这 个 功能 时 ， 编 译 器 必须 保证 重新 排序 的 指令 序列 不 会 导致 计 


| 算 结 果 的 改变 。 由 条 件 码 标志 产生 的 依赖 性 降低 了 编译 器 对 指令 


重新 排序 的 灵活 性 。 Compare RSR 
考虑 图 8-17a 中 的 指令 序列 ， 假 设 Compare 指 令 和 Branch=0 指 Branch=0 .: 

令 的 执行 按 图 8-14 那 样 进行 。 因 为 转移 决策 必须 等 待 Compare 指 a) 一 个 程序 片段 

令 的 结果 ， 所 以 转移 在 步 难 E, 而 不 是 D: 发 生 。 可 以 通过 互 换 Add 

指令 和 Compare 指 令 来 减 小 Branch 指 令 的 执行 时 间 ， 如 图 8-17b 所 Compare R3,R4 

示 。 这 会 使 转移 指令 相对 于 Compare 指 令 延 迟 1 个 周期 。 从 而 ， A 0 a 

Branch 指 令 正 在 译 码 时 就 能 得 到 Compare 指 令 的 结果 ， 并 且 作 出 

正确 的 转移 决策 ， 并 不 需要 转移 预测 。 但 是 ， 只 有 在 Add 指 令 不 中 本 排序 的 指令 

影响 条 件 码 的 条 件 下 ， 才 能 互 换 Add 指 令 和 Compare 指 令 。 图 8-17 指令 重 排序 ， 


通过 以 上 的 观察 ， 我 们 就 处 理 条 件 码 的 方法 得 出 两 个 重要 的 结论 。 首 先 ， 要 提供 重新 排序 
指令 的 灵活 性 ， 条 件 码 标志 应 该 尽 可 能 少 受 指令 的 影响 。 其 次 ， 编 译 器 应 能 够 指出 程序 中 的 条 
件 码 受到 哪 条 指令 的 影响 ， 以 及 不 受 哪 条 指令 的 影响 。 带 有 流水 线 思 想 设 计 的 指令 集 通常 提供 
比较 理想 的 灵活 性 。 图 8-17b 是 重新 排序 的 指令 ， 它 假设 条 件 码 标 志 只 有 在 明确 指出 是 作为 指令 
OP 码 中 的 一 部 分 时 才 受 影响 。SPARC 和 ARM 体 系 结构 提供 这 种 灵活 性 。 


85 数据 通路 和 控制 


我 们 在 第 7 章 中 介绍 了 处 理 器 内 部 数据 通路 的 组 成 结构 。 考 虑 图 7-8 给 出 的 三 总 线 结构 。 为 
了 使 它 适 用 于 流水 线 执 行 ， 可 以 将 其 修改 成 如 图 8-18 所 示 的 形式 ， 其 支持 4 段 流水 线 。 根 据 使 用 
的 寻 址 方式 和 实现 细节 的 不 同 ， 数 据 高 速 缓存 中 的 操作 可 能 会 在 E 段 或 之 后 的 段 中 发 生 。 可 以 注 
意 到 它 对 图 7-8 所 做 的 几 个 重要 改变 : 





寄存 器 文件 









控制 信号 流水 线 












指令 译 码 器 


指令 队列 







; 
存储 器 地 址 
( 取 指 令 ) 





指令 高 速 缓存 


存储 器 地 址 | 
( 存 取 数 据 ) 


| 


数据 高 速 缓存 
图 8-18 为 流水 线 执行 而 修改 的 数据 通路 ， 在 ALU 的 输入 和 输出 端 有 中 间 存 储 缓 冲 器 


1. 具有 单独 的 指令 和 数据 高 速 缓存 ,它们 分 别 通 过 单独 的 地 址 和 数据 线 与 处 理 器 相连 。 这 就 
要 求 有 两 种 MAR 寄 存 器 ，IMAR 用 来 访问 指令 高 速 缓存 ，DMAR 用 来 访问 数据 高 速 缓存 。 

2. PC 直接 连接 到 IMAR， 以 便当 独立 的 ALU 操 作 发 生 时 PC 的 内 容 能 够 传送 到 IMAR 中 。 

3. DMAR 中 的 数据 地 址 可 直接 从 寄存 器 文件 或 者 ALU 中 获得 ， 以 支持 寄存 器 间接 和 变 址 等 
址 方式 。 

4. 对 于 读 写 操作 采用 独立 的 MDR 寄 存 器 。 在 存 取 操作 期 间 ， 数 据 能 够 直接 在 这 些 寄存 器 和 
寄存 器 文件 之 间 传送 而 不 需 经 过 ALU.。 

5. 在 ALU 的 输入 和 输出 端 引入 缓冲 寄存 器 。 图 8-7 中 的 寄存 器 是 SRC1、SRC2 和 RSLT。 在 图 
8-18 中 不 包括 转发 连接 。 如 果 需 要 可 以 加 上 。 

6. 指令 寄存 器 被 指令 队列 取代 ， 指 令 队列 从 指令 高 速 缓存 中 取 指令 。 

7. 指令 译 码 器 的 输出 连接 到 控制 信号 流水 线 。 缓 冲 控制 信号 以 及 把 控制 信号 随 着 指令 从 
一 个 段 传送 到 下 一 段 的 要 求 在 8.1 节 讨论 过 。 在 图 8-2a 中 流水 线 保存 着 缓冲 器 B2 和 B3 中 的 榨 制 


信号 。 
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下 列 操作 能 够 在 图 8-18 中 的 处 理 器 中 独立 执行 : 

* 从 指令 缓存 中 读 指令 。 

。 使 PC 增值 。 

“ 指令 译 码 。 

“ 从 数据 高 速 缓存 中 读 或 向 数据 高 速 缓存 中 写 。 

“从 寄存 器 文件 读 两 个 以 上 寄存 器 的 内 容 。 

“向 寄存 器 文件 中 写 人 一 个 寄存 器 。 

e 执行 ALU 操 作 。 
由 于 这 些 操作 没有 使 用 任何 共享 资源 ， 所 以 它们 能 以 任何 一 种 组 合 方式 同时 执行 。 该 结构 提供 
了 实现 图 8-2 中 4 段 流水 线 所 需要 的 灵活 性 。 例 如 ， 假 设 I 、I2、Is 和 和 是 4 条 指令 序列 。 如 图 8-2a 
所 示 ， 下 列 活动 在 4 个 时 钟 周期 中 都 会 发 生 : 

“把 指令 I 的 结果 写 和 到 寄存 器 文件 中 。 

“从 寄存 器 文件 中 读 指 令 的 操作 数 。 

* 对 指令 I 进行 译 码 。 

。 取 指令 I 并 递增 PC 的 值 。 


8.6 超标 量 操作 


流水 线 使 指令 的 并 发 执行 成 为 可 能 。 在 流水 线 中 同时 存在 多 条 指令 ， 不 过 它们 位 于 执行 的 
不 同 阶段 。 当 一 条 指令 在 执行 ALU 操 作 时 ， 另 一 条 指令 正在 译 码 而 又 有 一 条 正 从 存储 器 中 取出 。 
指令 按照 严格 的 程序 顺序 进 和 流水线。 没有 阻塞 时 ， 在 每 一 个 时 钟 周期 有 一 条 指令 进入 流水 线 ， 
并 有 一 条 指令 执行 完成 。 这 意味 着 流水 线 处 理 器 的 最 大 吞吐 量 是 每 个 时 钟 周期 一 条 指令 。 

一 种 更 先进 的 方法 是 使 处 理 器 配备 有 大 量 的 处 理 部 件 ， 以 便 在 每 一 处 理 阶 段 并 行 处 理 多 条 
指令 。 有 了 这 种 方案 ， 多 条 指令 在 同一 个 时 钟 周期 开始 执行 ， 这 种 处 理 器 称 为 使 用 了 多 发 操作 。 
这 种 处 理 器 指令 执行 的 吞吐 量 能 够 达到 每 周期 执行 多 条 指令 ， 它 们 通常 被 称 为 超标 量 处 理 器 。 
许多 现代 高 性 能 处 理 器 就 是 采用 这 种 方式 。 

在 8.3 节 介绍 了 指令 队列 的 思想 。 我 们 指出 为 了 保持 指令 队列 是 满 的 ， 处 理 器 应 该 能 够 一 次 
从 高 速 缓存 中 取出 多 条 指令 。 对 于 超标 量 操作 ， 这 种 安排 是 必要 的 。 多 发 操作 要 求 与 高 速 缓存 
之 间 要 有 较 宽 的 通路 ， 还 要 有 大 量 的 执行 部 件 。 同 时 ， 还 要 为 整数 指令 和 浮 点 指令 提供 单独 的 
执行 部 件 。 

图 8-19 给 出 了 包含 有 两 个 执行 部 件 的 处 理 器 例子 ， 一 个 用 于 整数 操作 ， 一 个 用 于 浮 点 操作 。 
取 指 令 部 件 能 够 一 次 读 取 两 条 指令 并 把 它们 存储 在 指令 队列 中 。 在 每 一 个 时 钟 周 期 ， 调 度 部 件 
从 队列 头 部 取出 两 条 指令 进行 译 码 。 如 果 一 条 是 整数 指令 ， 一 条 是 浮 点 指令 ， 就 不 会 存在 阻塞 
问题 ， 那 么 这 两 条 指令 就 可 以 在 同一 时 钟 周 期 内 进行 调度 。 

在 超标 量 计算 机 中 ， 各 种 阻塞 对 性 能 的 负面 影响 变 得 更 加 明显 。 编 译 器 能 够 通过 合理 的 先 
择 和 指令 排序 来 避免 许多 阻塞 。 例 如 ， 对 于 图 8-19 中 的 处 理 器 ， 编 译 器 应 该 尽量 交 又 浮 点 和 整 
数 指令 。 这 样 能 够 使 调度 部 件 保持 整数 和 浮 点 部 件 在 大 部 分 时 间 都 处 于 工作 状态 。 总 之 ， 如 果 
编译 器 能 够 最 大 限度 地 利用 可 获得 的 硬 部 件 来 安排 程序 指令 ， 就 可 以 获得 性 能 上 的 提高 。 

流水 线 时 序 如 图 8-20 所 示 。 阴 影 部 分 表示 在 浮 点 部 件 中 的 操作 。 浮 点 部 件 利用 3 个 时 钟 周期 
来 完成 在 1 中 规定 的 浮 点 操作 。 整 数 部 件 在 一 个 时 钟 周期 内 完成 L 的 执行 。 还 假定 浮 点 部 件 内 部 
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是 由 3 段 流水 线 构成 的 。 因 此 ， 在 每 一 个 时 钟 周 期 浮 点 部 件 还 能 够 接受 一 条 新 指令 。 从 而 ， 指 令 
LAL 在 第 3 个 周期 进入 调度 部 件 ， 两 者 都 在 第 4 个 周期 调度 。 整 数 部 件 能 够 接受 一 条 新 指令 ， 因 
为 指令 P 已 进行 到 写 阶段 。 指 令 D 仍 在 执行 阶段 ， 但 是 它 已 移 到 浮 点 部 件 内 部 流水 线 的 第 二 阶段 
中 。 因 此 ， 指 令 B 能够 进入 第 一 阶段 。 假 设 没 有 遇 到 阻塞 ， 指 令 按照 图 示 方 式 完成 执行 。 





图 8-19 含有 两 个 执行 部 件 的 处 理 器 
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图 8-20 在 图 8-19 的 处 理 器 中 的 指令 执行 流 的 例子 ， 假 设 没有 遇 到 阻塞 
8.6.1 无 序 执行 


在 图 8-20 中 ， 按 照 指令 在 程序 中 出 现 的 顺序 进行 调度 。 然 而 ， 指 令 的 执行 是 无 序 的 。 这 样 
会 带 来 一 些 问题 吗 ? 我 们 已 经 讨论 过 指令 之 间 的 依赖 性 所 产生 的 问题 。 例 如 ， 如 果 指 令 D 依 赖 
的 结果 ， 那 么 I 的 执行 就 会 被 延迟 。 只 要 这 种 依赖 性 能 够 被 正确 处 理 ， 就 不 必 延 迟 指令 的 执行 。 
然而 ， 在 考虑 指令 引起 异常 的 概率 时 又 出 现 了 新 的 困难 。 引 起 异常 的 原因 可 能 是 取 操作 数 期 间 
的 总 线 错误 ,或 者 是 非法 操作 导致 的 ， 比 如 被 0 除 。 在 第 4 个 周期 1 的 结果 写 回 到 寄存 器 文件 中 ， 
如 果 是 指令 I 引起 的 异常 ， 那 么 程序 的 执行 就 会 出 现 不 一 致 的 状态 。 程 序 计数 器 指向 的 指令 是 
异常 发 生 处 的 指令 。 但是， 一 个 或 多 个 成 功 的 指令 已 经 执行 完成 。 如 果 这 种 状况 允许 ， 就 说 该 
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处 理 器 有 不 精确 异常 。 

为 了 保证 异常 发 生 时 状态 的 一 致 性 ， 指 令 的 执行 结果 必须 严格 按 程 序 顺 序 写 入 到 目标 位 置 
中 。 这 意味 着 必须 延迟 图 8-20 的 W; 段 直到 第 6 个 周期 ， 才 能 接受 指令 ， 如 图 8-21a 所 示 。 如 果 
在 指令 期 间 发 生 异 常 ， 那 么 丢弃 可 能 已 经 部 分 执行 的 所 有 后 续 指令 ， 这 被 称 作 精确 异常 。 


— 时间 
时 钟 周期 1 2 6 7 


wm [o o e e e 
as EE E 


I; (Fsub) 





l4 (Sub) 





a) 1ER G 
一 = kti 
时 钟 周期 1 2 3 4 5 
.. m —— 
lh (Fadd) RF, Di Ea | Bs | Ec | Wi 


l (Add) 


[3 (Fsub) 


l4 (Sub) 





b) 使 用 临时 寄存 器 


图 8-21 指令 按 程序 顺序 完成 


在 外 部 中 断 的 情况 下 很 容易 提供 精确 异常 。 当 收 到 外 部 中 断 时 ， 调 度 部 件 停止 从 指令 队列 
中 读 取 新 指令 ， 丢 弃 队 列 中 剩余 的 指令 。 所 有 未 执行 完 的 指令 继续 执行 。 在 这 一 点 ， 处 理 器 和 
所 有 寄存 器 都 处 于 一 致 的 状态 ， 可 以 对 中 断 进行 处 理 了 。 


8.6.2 执行 完成 


我 们 希望 使 用 无 序 执行 ， 它 可 以 使 执行 部 件 尽 可 能 自由 地 执行 其 他 指令 。 同 时 ， 指 令 必 须 
按 程 序 顺 序 完 成 以 允许 精确 异常 。 如 果 人 允许 图 8-20 所 示 的 那 种 情况 执行 ， 这 些 表 面 上 的 冲突 要 
求 就 很 容易 解决 ， 但 是 结果 要 写 到 临时 寄存 器 。 临 时 寄存 器 的 内 容 按 正确 的 程序 顺序 传送 到 永 
入 寄存 器 中 。 这 种 方法 如 图 8-21b 所 示 。TW 步 向 临时 寄存 器 写 人 。W 步 是 最 后 一 步 ， 在 这 一 步 
中 临时 寄存 器 的 内 容 传送 到 合适 的 永久 寄存 器 中 。 这 一 步 通 常 叫做 提交 步 ， 因 为 从 那 点 后 指令 
的 影响 不 能 再 被 恢复 。 如 果 是 由 某 条 指令 造成 异常 ， 那 么 任何 已 经 执行 的 后 续 指 令 的 结果 仍 会 
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保存 在 临时 寄存 器 中 ,并 且 可 以 安全 地 丢弃 。 

临时 寄存 器 承担 永久 寄存 器 的 作用 ， 保 存 永 久 寄存 器 的 数据 并 且 指 定 为 同样 的 名 称 。 例 如 ， 
WRD 的 目标 寄存 器 是 R5， 那 么 在 第 6 个 和 第 7 个 时 钟 周 期 ， 在 TW: 步 用 到 的 临时 寄存 器 就 作为 
R5 来 对 待 。 在 这 期 间 ， 临 时 寄存 器 的 内 容 可 传送 给 任何 指向 R5 的 后 续 指 令 。 由 于 这 个 特性 ， 这 
项 技术 被 称 为 寄存 器 重 命名 。 注 意 临 时 寄存 器 只 用 于 按 程 序 顺 序 跟 在 L 之 后 的 指令 。 如 果 前 一 
条 指令 需要 在 第 6 个 或 第 7 个 周期 读 R5， 那 么 它 实 际 上 真正 读 的 是 寄存 器 R5， 这 个 寄存 器 中 仍然 
保存 着 未 被 指令 D 修改 的 数据 。 

当 允 许 无 序 执行 时 ， 需 要 一 个 专门 的 控制 部 件 来 保证 指令 按照 正确 的 顺序 提交 。 这 个 部 件 
称 为 提交 部 件 。 它 使 用 一 个 称 为 重新 排序 缕 冲 器 的 队列 来 决定 下 一 次 应 该 提交 哪 条 (哪些 ) 指 
令 。 随 着 指令 不 断 的 调度 执行 ， 指 令 严格 地 按照 程序 顺序 进入 队列 。 当 一 条 指令 到 达 队 首 并 且 
该 指令 的 执行 已 经 完成 时 ， 相 应 的 结果 从 临时 寄存 器 传送 到 永久 寄存 器 中 ， 指 令 从 队列 中 清除 。 
释放 所 有 分 配给 该 指令 的 资源 ， 包 括 临 时 寄存 器 。 这 时 就 说 该 指令 已 经 被 释放 了 。 因 为 只 有 指 
令 位 于 队 首 时 才 会 被 释放 ， 在 它 之 前 调度 的 所 有 指令 也 一 定 都 被 释放 了 。 因 此 ， 指 令 可 以 按照 
无 序 方式 结束 执行 ， 但 必须 按照 程序 的 顺序 来 释放 。 


8.6.3 调度 操作 


我 们 现在 讨论 调度 操作 。 当 做 出 调度 决策 时 ， 调 度 部 件 必须 确保 已 经 具备 了 指令 执行 所 需 
要 的 所 有 资源 。 例 如 ， 由 于 指令 的 执行 结果 可 能 需要 写 到 临时 寄存 器 ， 所 以 所 需要 的 寄存 器 必 
须 是 空闲 的 ， 并 且 保留 出 来 用 作 那 条 指令 进行 调度 操作 的 一 部 分 。 在 重新 排序 缓冲 器 中 也 必须 
为 该 指令 留 出 位 置 。 当 分 配 完 所 需要 的 所 有 资源 包括 相应 的 执行 部 件 时 ， 便 可 以 开始 调度 这 条 
指令 了 。 

指令 可 以 按照 无 序 方式 进行 调度 吗 ” 例 如 ， 在 图 8-20b 中 指令 由 于 源 操作 数 的 高 速 缓存 失 
效 而 延迟 ， 整 数 部 件 在 第 4 个 周期 正在 工作 而 无 法 调度 5， 那 么 这 时 可 以 对 1 进行 调度 吗 ? 理论 
上 这 是 可 以 的 ， 条 件 是 在 重新 排序 缓冲 器 中 为 指令 预 留 出 空间 ， 以 确保 所 有 指令 按 正 确 次 序 
释放 。 无 序 调度 指令 需要 相当 小 心 。 如 果 在 L 等 待 某 些 资源 时 对 进行 调度 ， 必 须 确保 不 会 发 生 
死 锁 。 

死 镇 是 当 两 个 部 件 A 和 B 使 用 同一 共享 资源 时 出 现 的 一 种 状态 ， 假 设 B 部 件 要 等 待 A 部 件 完 
成 后 才能 完成 它 的 任务 。 同 时 ，A 部 件 所 需要 的 资源 已 经 分 配给 了 B 部 件 。 如 果 这 种 情况 发 生 ， 
那么 两 个 部 件 都 不 能 完成 任务 。A 部 件 等 待 它 所 需要 的 资源 ， 而 该 资源 正 被 B 部 件 占有 。 同 时 ， 
B 部 件 在 释放 该 资源 之 前 等 待 A 部 件 完成 。 | 

如 果 指令 的 调度 是 无 序 的 ， 以 下 的 方式 可 能 会 出 现 死 锁 。 假 设 处 理 器 在 调度 Is 时 只 有 一 个 
临时 寄存 器 ， 该 寄存 器 留 给 I; 使 用 。 由 于 指令 0 正在 等 待 临时 寄存 器 而 无 法 调度 ， 而 临时 寄存 器 
直到 指令 5 释放 后 才 会 空闲 。 但 是 指令 5 不 能 在 1 之 前 释 让， 所 以 产生 死 锁 。 

为 了 预防 死 锁 ， 调 度 必须 考虑 许多 因素 。 因 此 ， 无 序 调 度 指令 可 能 会 大 大 增加 调度 部 件 的 
复杂 度 。 这 也 意味 着 可 能 需要 更 多 的 时 间 做 出 调度 决策 。 由 于 这 些 原因 ， 大 多 数 处 理 器 只 使 用 
有 序 调度 。 因 此 ， 指 令 的 调度 和 指令 释放 都 是 按照 程序 中 的 顺序 进行 的 。 在 这 两 事件 之 间 ， 几 
条 指令 的 执行 可 以 按 它们 自己 的 速度 进行 ， 只 有 指令 间 的 内 部 依赖 性 会 影响 到 它们 。 

在 下 一 节 ， 我 们 将 以 UltraSPARC II 作为 范例 来 介绍 商业 上 成 功 的 超标 量 流水 线 处 理 器 。 在 
本 章 出 现 的 各 种 问题 在 该 处 理 器 中 都 得 到 了 解决 ， 并 且 它 的 选择 方案 很 有 指导 意义 。 
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8.7 UltraSPARC II 实例 


处 理 器 设计 在 近 几 年 有 很 大 的 提高 。 以 纯 RISC 或 纯 CISC 作 为 处 理 器 分 类 依据 已 不 再 适合 ， 
因为 现代 高 性 能 处 理 器 中 都 包含 这 两 种 设计 风格 。 

早期 的 RISC 处 理 器 说 明 有 很 多 特性 可 以 对 高 性 能 产生 影响 。 下 列 两 项 观察 结果 是 非常 重要 的 : 

。 流 水 线 ， 它 使 处 理 器 能 够 同时 执行 数 条 指令 ， 只 要 流水 线 不 经 常 出 现 延迟 ， 性 能 就 可 以 得 

到 很 大 的 提高 。 

“硬件 和 编译 器 设计 之 间 的 紧密 配合 ， 使 编译 器 通过 减少 引起 流水 线 拖延 的 事件 最 大 限度 地 

利用 流水 线 结构 。 

正 是 这 些 因素 而 不 是 简单 的 精简 指令 集 促 成 了 RISC 处 理 器 的 成 功 。 在 这 方 商 尤 其 重要 的 是 
硬件 设计 之 间 的 紧密 合作 ， 尤 其 是 流水 线 结构 和 编译 器 设计 之 间 的 紧密 协调 。 当 今 的 处 理 器 都 
具有 很 高 的 性 能 ， 这 主要 归 因 于 编译 技术 的 发 展 ， 编 译 技术 继而 又 引发 了 新 的 硬件 特性 ， 这 些 
新 的 硬件 特性 在 过 去 几 年 里 可 能 是 毫 无 用 处 的 。 

SPARC 体 系 结构 是 SUN 工 作 站 使 用 的 处 理 器 基础 ， 它 是 一 个 非常 优秀 的 例子 。SUN 所 实现 
的 一 款 SPARC 体 系 结构 的 处 理 器 叫做 UltraSPARC I ， 也 正 是 我 们 将 要 讨论 的 处 理 器 。 选 择 这 款 
处 理 器 而 设 有 选择 第 3 章 中 介绍 的 处 理 器 ， 是 因为 它 可 以 很 好 地 说 明 超标 量 操作 以 及 在 本 章 讨论 
过 的 大 多 数 流水 线 设 计 选择 和 权衡 。 我 们 先 从 SPARC 体 系 结构 的 简单 介绍 开始 。 要 了 解 完整 的 
描述 ,读者 可 查阅 SPARC 体 系 结构 手册 站。 


8.7.1 SPARC 体 系 结构 


SPARC 即 可 扩 缩 处 理 器 体系 结构 (Scalable Processor ARChitecture ) 。 它 是 处 理 器 指令 集体 
系 结构 的 具体 规格 ， 也 就 是 说 ， 它 是 处 理 器 指令 集 和 寄存 器 组 织 的 规格 ， 无 论 这 些 指令 集 和 看 
件 组 织 是 如 何 用 硬件 实现 的 。 而 且 ，SPARC 是 “开放 的 体系 结构 "” ， 这 意味 着 除了 SUN 公 司 ， 其 
他 计算 机 公司 可 以 开发 它们 自己 的 硬件 来 实现 相同 的 指令 集 。 

SPARC 体 系 结构 在 1987 年 首次 公布 ， 它 源 自 于 80 年 代 早期 在 加 州 大 学 伯克利 分 校 的 一 个 项 
目 中 的 开发 思想 。 在 这 个 项 目 中 产生 了 和 精简 指令 集 计算 机 以 及 相应 的 缩写 “RISC”。SUN 公 司 和 
其 他 几 个 处 理 器 芯片 制造 商 已 经 设计 并 生产 了 基于 这 种 体系 结构 的 许多 处 理 器 ， 涵 盖 了 各 种 性 
能 级 别 。SPARC 体 系 结构 规格 由 国际 协会 控制 ， 它 每 隔 几 年 引入 新 的 增强 版 本 。 最 新 版 本 是 
SPARC-V9, 


SPARC 体 系 结构 的 指令 集 具 有 显著 的 RISC 特 性 。 该 体系 结构 规格 描述 了 一 个 数据 和 存储 器 


地 址 都 是 64 位 长 的 处 理 器 。 指 令 长 度 是 相同 的 ， 都 是 32 位 长 ， 并 提供 整数 指令 和 浮 点 指令 。 


有 两 个 寄存 器 文件 ， 一 个 用 于 整 型 数据 ， 另 一 个 用 于 浮 点 数据 。 整 数 寄存 器 长 度 为 64 位 。 
它们 的 编号 根据 实现 的 不 同 ， 可 以 使 用 从 64 到 528 的 数字 。SPARC 使 用 称 为 寄存 器 窗口 的 技术 。 
在 任何 给 定 的 时 间 里 ， 应 用 程序 只 看 到 32 个 寄存 器 ， 即 RO 到 R31。 在 这 些 寄存 器 中 ， 前 8 个 是 总 
可 以 被 访问 的 全 局 寄存 器 ， 其 余 24 个 是 局 部 寄存 器 。 

浮 点 寄存 器 只 有 32 位 长 ， 根 据 第 6 章 描述 的 下 EE 标准 ， 这 是 单 精度 浮 点 数 的 长 度 。 指 令 集 包 
括 用 于 双 精 度 和 四 倍 精 度 操作 的 浮 点 指令 。 用 编号 连续 的 两 个 浮 点 寄存 器 存储 双 精 度 操作 数 ， 用 
编号 连续 的 4 个 浮 点 寄存 器 存储 四 倍 精度 操作 数 。 总 共有 64 个 寄存 器 ，F0 到 F63。 单 精度 操作 数 可 
以 存储 在 F0 到 F31， 双 精度 操作 数 在 F0, F2, F4, ---, F62， 四 信和 精度 操作 数 在 FO, F4, F8, …, F60 中 。 





H 水 线 343 


存 、 取 指令 

只 允许 存 或 取 指 令 对 存储 器 进行 访问 ， 在 存储 器 中 操作 数 可 以 是 8 位 的 字 节 、16 位 的 半 字 或 
32 位 的 字 。 存 、 取 指令 也 处 理 64 位 数 。 这 个 64 位 数 被 分 成 两 类 : 扩展 字 或 双 字 。LDX (Load 
extended) 指令 将 称 为 扩展 字 的 64 位 数 装 入 到 处 理 器 的 一 个 整数 寄存 器 中 。 双 字 由 两 个 32 位 字 构 
成 。 利 用 一 条 LDD (Load double) 指令 将 这 两 个 字 装 入 到 编号 连续 的 处 理 器 寄存 器 中 。 它 们 被 
放 到 每 个 寄存 器 的 低 32 位 ， 高 位 用 0 补充 。 其 中 ， 第 一 个 寄存 器 是 指令 中 指定 的 寄存 器 ， 它 的 号 
码 必须 是 偶数 。 处 理 双 字 的 存 取 指 令 在 处 理 存储 器 和 浮 点 寄存 器 之 间 传送 多 精度 浮 点 操作 数 时 
是 很 有 用 的 。 

存 、 取 指令 使 用 的 寻 址 方式 是 两 种 变 址 寻 址 方式 中 的 一 种 ， 如 下 : 

1. 有 效 地 址 是 两 个 寄存 器 内 容 之 和 : 

EA = [Radrl] + [Radr2] 
2 有 效 地 址 是 一 个 寄存 器 内 容 和 指令 中 的 立即 数 相 加 的 和 : 
= [Radr1] + Immediate 

对 于 大 多 数 指令 ， 立 即 数 是 一 个 13 位 有 符号 数 。 它 是 完成 了 符号 扩展 到 64 位 后 与 Radrl 中 的 内 容 
相 加 的 。 

使 用 第 一 种 寻 址 方式 的 取 指令 写作 

Load [Radr1 + Radr2], Rdst 
它 生成 有 效 地 址 [Radr1] + [Radr2]， 并 把 该 单元 的 内 容 装 入 Rdst 寄 存 器 中 。 对 于 立即 偏 移 量 的 情 
况 ，Radr2 由 立即 数 来 替代 ， 即 
Load [Radrl + Imm], Rdst 


存储 指令 使 用 类 似 语法 ， 第 一 个 操作 数 表示 源 寄存 器 ， 数 据 从 这 里 存储 到 存储 器 ， 如 下 : 
Store Rsrc, [Radrl + Radr2] 
Store Rsrc, [Radrl + Imm] 
在 SPARC 指 令 推 荐 的 语法 中 ， 寄存 器 由 多 后 跟着 寄存 器 号 表示 。%r2 或 %2 都 表示 寄存 器 号 2。 然 
而 ， 为 了 便于 阅读 并 且 与 前 几 章 保持 一 致 ， 我 们 用 R0，R1 等 来 表示 整数 寄存 器 ， 用 FE0, El, … 来 
表示 浮 点 寄存 器 。 | 
作为 实例 ， 考 虑 取 无 符号 字 节 指令 
LDUB [R2 + R3], R4 
这 条 指令 从 存储 器 单元 RR21+[R3] 处 取出 一 个 字 节 放 到 寄存 器 R4 的 低 8 位 ， 高 56 位 用 0 填充 。 取 有 
符号 字 指 令 
LDSW [R2 + 2500], R4 
从 单元 [R21 + 2500 读 一 个 32 位 字 ， 符 号 扩展 到 64 位 ， 然 后 把 它 存储 到 寄存 器 R4 中 。 
算术 和 逻辑 指令 
该 处 理 器 还 提供 一 般 的 算术 和 逻辑 指令 集 。 在 表 8-1 中 给 出 了 一 些 例子 。 我 们 在 8.4.2 节 指出 ， 
一 条 指令 只 有 后 续 的 条 件 转移 指令 对 条 件 码 进行 测试 时 才 设 置 条 件 码 标志 。 这 最 大 限度 地 增加 
了 编译 器 在 重 排序 指令 方面 的 灵活 性 。SPARC 指 令 集 就 是 秉承 这 一 特征 进行 设计 的 。 其 中 ， 有 
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两 种 算术 和 逻辑 指令 ， 一 种 设置 条 件 码 标志 ， 另 一 种 不 设置 。 操 作 码 的 后 级 cc 用 于 指示 应 设置 
的 标志 人 位。 例如， 指令 ADD、SUB、SMUL ( 带 符号 乘 )、OR 和 XOR 不 影响 标志 位 ， 而 ADDec 
和 SUBcc 则 影响 标志 位 。 
寄存 器 R0 的 值 总 是 0。 当 它 用 作 目 标 操作 数 时 ， 指 令 的 结果 将 丢弃 。 例 如 ， 指 令 
SUBcc R2, R3, RO 
将 R2 的 内 容 减 去 R3 的 内 容 ， 并 设置 条 件 码 标志 ， 丢 弃 减 操作 的 结果 。 实 质 上 ， 这 是 一 条 比较 指 
令 ， 它 的 替代 语法 是 
CMP R2, R3 
在 SPARC 术 语 中 ，CMPMH 做 合成 指令 。 它 不 是 真正 的 可 由 硬件 识别 的 指令 ， 只 是 为 了 程序 员 方 
便 而 提供 。 编 译 器 将 采用 SUBcc 指 令 代替 CMP 指 令 。 


表 8-1 SPARC 指 令 实 例 








# s # g 

ADD R5, R6, R7 整数 相 加 : R7~[R5] + [R6] 

ADDcc R2, R3, R5 R5<—[R2] + [R3], 设 喷 条 件 码 标志 

SUB R5, Imm, R7 整数 相 减 : R7-[R5] -Imm (扩展 符号 ) 

AND R3, Imm, R5 按 位 与 : R5<—[R3]AND Imm (扩展 符号 ) 

XOR R3, R4, R5 按 位 异 或 : RS5<—[R3] XOR[R4] 

FADDq F4, F12, F16 淫 点 数 相 加 ， 四 倍 和 精度 : F12- [F4] + [F12] 

FSUBs F2, F5, F7 浮 点 数 相 碱 ， 单 精度 : F7 e [F2] - [F5] 

FDIVs F5, F10, F18 浮 点 数 相 除 ， 单 精度 : F18- {F5} /fF10] 

LDSW R3, R5, R7 [R3] + [R5] 处 32 位 字符 号 扩展 为 64 位 

LDX R3,R5,R7 [R3] + RSET aF 

LDUB R4, Imm, R5 从 存储 器 单 元 [R4]+Imm 取 无 符号 字 节 ， 该 字 节 被 装 入 寄存 器 R5 的 
低 8 位 ， 而 高 位 被 0 填充 

STW R3, R6, R12 从 寄存 器 R3 存 储 字 到 存储 器 位 图 [R6] + [R12] 

LDF R5, R6, F3 在 地 址 [R5] + fR6] 处 取 32 位 字 ， 并 装 入 浮 点 寄存 器 F3 

LDDF R5, R6, F8 在 [R5] + [R6] 处 取 双 字 ， 装 人 浮 点 寄存 器 F8 和 F9 

STF F14, R6, Imm 从 学 点 寄存 器 F14 存 储 字 到 存储 器 单元 [R6] + Imm 

BLE icc, Label 检测 icc 标 志 ， 如 果 小 于 或 等 于 0， 转 移 到 Label 

BZ, pn xcc, Label 检测 xcc 标 志 ， 如 果 等 于 0， 转 移 到 Label， 预 测 转移 不 发 生 

BGT, a, pt icc, Label 检测 32 位 整数 标志 位 ， 如 果 大 于 0， 转 移 到 Labei， 设 置 取消 位 ， 
预测 转移 发 生 

FBNE, pn Label 检测 浮 点 状态 标志 ， 如 果 不 相等 则 转移 ; 取消 位 被 置 为 0， 预 测 
转移 不 发 生 


条 件 码 寄存 器 CCR 中 包含 两 组 条 件 码 标志 icc 和 xcc， 分 别 用 于 整数 和 扩展 条 件 码 。 每 组 条 件 
码 都 是 由 4 个 标志 位 N、Z、V 和 C 构 成 。 设 置 条 件 码 标志 的 指令 ， 例 如 ADDcec， 可 以 设置 icc 和 
xcc 位 ; xcc 标 志 的 设置 是 基于 指令 的 64 位 结果 ，icc 标 志 的 设置 仅仅 参考 低 32 位 。 用 于 浮 点 操作 
的 条 件 码 存储 在 一 个 64 位 寄存 器 中 ， 该 寄存 器 叫做 浮 点 状态 寄存 器 (FSR )。 

转移 指令 

转移 处 理 中 采用 的 方式 是 决定 性 能 的 一 个 重要 因素 。SPARC 指 令 集 中 的 转移 指令 具有 若干 
个 特征 ， 这 些 特 征用 来 提高 流水 线 处 理 器 的 性 能 ， 并 有 助 于 编译 器 优化 输出 代码 。 

SPARC 处 理 器 使 用 带 有 延迟 模 (参见 8.3.2 节 ) 的 延迟 转移 。 转 移 指令 包括 转移 预测 位 ， 编 
译 器 利用 这 些 预 测 位 来 通知 硬件 所 期 望 的 转移 行为 。 转 移 指令 还 包含 一 个 无 效 位 ， 用 来 提高 处 





理 延 迟 槽 中 指令 的 灵活 性 。 这 条 指令 总 是 可 以 执行 的 ， 但 是 它 不 输出 结果 直到 得 到 转移 决策 后 
才 提 交 。 如 果 需 要 进行 转移 ， 将 延迟 槽 中 的 指令 执行 完 并 对 结果 进行 处 理 。 如 果 无 须 转移 ， 若 
取消 位 等 于 1 则 该 指令 将 被 取消 。 否 则 ， 完 成 指令 的 执行 。 
无 论 是 否 执行 转移 ， 编 译 器 可 以 在 延迟 档 中 放 入 一 条 所 需要 的 指令 。 它 可 能 是 一 条 逻辑 上 
在 转移 指令 之 前 ， 但 却 可 以 移 到 延迟 槽 中 的 指令 。 在 这 种 情况 下 无 效 位 应 该 设置 为 0。 否 则 ， 只 
要 需要 转移 ， 延 迟 槽 中 应 该 填 人 一 条 要 执行 的 指令 ， 此 时 无 效 位 应 该 设置 为 1。 
条 件 转移 指令 可 以 测试 icc、xcc 或 FSR 标 志 。 例 如 ， 指 令 
BGT, a, pt icc, Label 
如 果 设 置 icc 标 志 位 的 前 一 条 指令 产生 大 于 零 的 结果 ， 将 会 转移 到 单元 Label 处 。 指 令 将 无 效 位 和 
转移 预测 位 都 设置 为 1。 指 令 
FBGT, a, pt Label 


除了 要 测试 FSR 标 志 以 外 ， 与 前 面 的 指令 完全 相同 。 如 果 未 指定 pt (predicted taken， 采 用 预测 ) 
或 pn (predicted not taken ， 不 采用 预测 )， 那 么 编译 器 默认 为 是 pt。 

图 8-22 给 出 一 个 例子 来 说 明 转 移 指令 中 的 预测 和 取消 设施 ， 这 是 一 个 将 列表 中 的 nz 个 64 位 整 
数 相 加 的 循环 程序 。 假 设 表 项 数目 作为 一 个 64 位 整数 存在 地 址 LIST 处 ， 该 数 后 面 是 连续 的 64 位 
的 被 加 数 。 还 假设 列表 中 至 少 存在 一 个 数据 项 ， 并 且 程 序 中 的 地 址 LIST 已 被 装 入 寄存 器 R3 中 。 

图 8-22a 给 出 的 是 为 了 在 非 流水 线 处 理 器 上 执行 而 写 的 循环 程序 。 为 了 在 SPARC 处 理 器 上 执 
行 ， 应 该 首先 重新 组 织 指令 以 便 有 效 地 利用 转移 延迟 槽 。 注 意 每 遍 循环 都 要 执行 LOOPSTART 后 
的 ADD 指 令 。 而且， 其 后 的 指令 没有 依赖 它 的 执行 结果 。 因 此 ， 这 条 指令 可 以 跟着 循环 末 的 转 
移 指令 移 人 延迟 槽 ， 如 图 8-22b 所 示 。 因 为 不 管 转移 的 结果 如 何 ， 它 都 可 以 被 执行 ， 所 以 转移 指 
令 中 的 无 效 位 设置 为 0 (这 是 默认 条 件 )。 


R3, 0, R6 载 人 列表 的 项 数 
R0, R0, R4 R4 作 为 列表 中 的 偏 移 量 
O| R0, R0, R7 清除 R7 作 为 累加 器 
LOOPSTART R3, R4, R5 将 列表 项 载 信 R5 
R5, R7, R7 将 数 加 到 累加 器 中 


R4, 8, R4 Fn8]2— An 
R6, 1, R6 减 小 R6 并 设置 状态 标志 
xcc, LOOPSTART 如 果 列 表 中 还 有 表 项 则 继续 循环 





a) 所 要 求 的 循环 程序 


R3, 0, R6 
R0, R0, R4 
RO, RO, R7 
R3, R4, R5 
R4, 8, R4 
R6, 1, R6 


xcc, LOOPSTART 采用 预测 ， 无 效 位 为 0 
RS，R7，R7 





b) 使 用 延迟 档 重 新 组 织 的 指令 
图 8-22 展示 转移 延迟 槽 和 转移 预测 作用 的 加 法 循环 
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至 于 转移 预测 ， 我 们 应 该 注意 到 ， 循 环 执行 次 数 等 于 表 项 的 数目 。 这 意味 着 ,除了 n = 1 的 
情形 ， 在 退出 循环 前 转移 会 发 生 多 次 。 因 此 ， 我 们 在 BG 指令 中 设置 转移 预测 位 以 表明 期 望 进行 
转移 。 

并 不 是 只 有 条 件 转移 指令 才能 检查 条 件 码 标志 。 例 如 ， 条 件 传 送 指令 MOVcc， 只 要 条 件 码 
满足 指令 后 组 cc 规定 的 条 件 ， 该 指令 就 将 数据 从 一 个 寄存 器 拷贝 到 另 一 个 寄存 器 中 。 考 虑 这 样 
的 两 条 指令 

CMP RS, R6 

MOVle icc, R5, R6 
这 里 如 果 icc 中 的 条 件 码 标志 小 于 或 等 于 条 件 (Z + (N @V) = 1 )， 那 么 MOVle 指 令 将 R5 的 内 容 拷 
贝 到 R6 中 。 最 后 的 结果 是 将 两 个 数 中 较 小 的 一 个 放 入 寄存 器 R6。 没 有 条 件 传 送 指令 时 ， 完 成 同 
样 的 任务 时 需要 一 个 转移 指令 ， 指 令 顺 序 如 下 : 

CMP RS5,R6 

BG icc, GREATER 

MOVA icc, R5, R6 

GREATER … 

其 中 MOVA 是 “一 直 传 送 ”(move-always) 指令 。MOYVle 指 令 不 仅 减少 了 所 需要 的 指令 数量 ， 
而 且 更 重要 的 是 它 避 免 了 在 流水 线 执行 中 由 转移 指令 引发 的 性 能 下 降 。 

该 指令 集 还 有 很 多 其 他 的 一 些 特 征 ， 这 些 特 征 可 以 最 大 限度 提高 流水 线 超 标量 处 理 器 的 性 
能 。 我 们 将 在 UltraSPARC H 处 理 器 的 上 下 文中 讨论 这 些 特征 。 这 些 特 征 包 含 的 思想 在 本 章 中 已 
经 介绍 过 。 


8.7.2 UltraSPARC II 


UltraSPARC I 处 理 器 的 主要 构件 块 如 图 8-23 所 示 。 该 处 理 器 使 用 两 级 高 速 缓存 : 一 个 外 部 
高 速 缓 存 (E-cache) 和 两 个 内 部 高 速 缓存 ， 而 在 两 个 内 部 高 速 缓 存 中 ， 一 个 用 于 指令 (Lcache )， 
一 个 用 于 数据 (D-cache)。 外 部 的 高 速 缓存 控制 器 在 处 理 器 芯片 上 ，、 用 于 存储 器 管理 的 控制 硬 
件 也 在 处 理 器 芯片 上 。 存储器 管理 部 件 使 用 两 个 转换 缓冲 器 ， 一 个 用 于 指令 iTLB ， 一 个 用 于 数 
据 4TLB。 处 理 器 用 系统 内 部 互 连 总 线 与 存储 器 和 IO 子 系统 进行 通信 。 

有 两 个 执行 部 件 ， 一 个 用 于 整数 操作 ， 一 个 用 于 浮 点 操作 。 每 个 部 件 中 包含 一 个 寄存 器 集 
以 及 两 个 用 于 指令 执行 的 独立 流水 线 。 因 此 ， 处 理 器 能 够 同时 执行 四 条 指令 : 两 条 整数 指令 和 
两 条 浮 点 数 指令 。 这 些 并 行 执行 的 指令 每 条 都 经 过 各 自 的 流水 线 。 如 果 有 足够 的 指令 并 且 四 条 
流水 线 中 没有 延迟 ， 那 么 每 个 时 钟 周 期 都 有 四 条 新 指令 进入 执行 阶段 。 

处 理 器 的 预 取 和 调度 部 件 (PDU) 负责 为 执行 部 件 供给 连续 的 指令 。PDU 是 在 指令 需要 之 
前 预 取 指 令 ， 并 把 它们 放 在 称 为 指令 缓冲 器 的 临时 存储 器 中 ， 指 令 缓冲 器 完成 图 8-19 中 指令 队 
列 的 作用 。 


8.7.3 流水 线 结构 


UltraSPARC I 有 一 条 9 段 指令 执行 流水 线 ， 如 图 8-24 所 示 。 每 一 段 的 功能 在 一 个 处 理 器 时 钟 
周期 内 完成 。 我 们 先 给 出 流水 线 操作 的 总 体 介绍 ， 之 后 再 具体 讨论 每 一 阶段 。 
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图 8-23 UltraSPARC I 处 理 器 的 主要 构件 块 
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图 8-24 UltraSPARC I 处理 器 的 流水 线 组 织 结构 
流水 线 的 前 三 段 对 所 有 指令 是 公用 的 。 在 第 1 段 (F) 从 指令 高 速 缓存 中 取 指 令 ， 在 第 2 段 
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(D) 进 行 部 分 译 码 。 接 着 在 第 3 段 (G) 选择 一 组 最 多 四 条 指令 并 行 执行 。 这 些 指令 接着 被 调度 到 
整数 和 浮 点 执行 部 件 中 。 

两 个 执行 部 件 中 每 个 都 包含 两 个 6 段 的 并 行 流水 线 。 前 四 段 执行 指令 指定 的 操作 ， 后 两 段 用 
于 检查 异常 以 及 保存 指令 结果 。 

指令 读 取 和 译 码 

PDU 从 指令 高 速 缓存 中 取 四 条 指令 进行 部 分 译 码 ， 并 将 结果 存在 指令 缓冲 器 中 。 指 令 缓冲 
器 最 多 可 以 容纳 12 条 的 指令 。 这 一 阶段 的 译 码 使 PDU 能 够 判定 指令 是 否 是 转移 指令 。 它 还 检测 
那些 可 以 对 流水 线 中 的 指令 加 速决 策 的 突出 特性 。 

指令 高 速 缓存 中 的 一 个 高 速 缓存 块 由 32 个 字 节 构成 。 一 个 块 可 以 容纳 8 条 指令 。 指 令 被 装 入 
高 速 缓存 时 是 按照 虚拟 地 址 存储 的 ， 以 便 PDU 可 以 迅速 地 读 取 指 令 而 无 需 地 址 转换 。 只 要 每 组 
指令 都 不 穿越 高 速 缓存 块 的 边界 ，PDU 可 保持 每 周期 四 条 指令 的 读 取 速 度 。 如 果 高 速 缓存 块 中 
剩 干 不 到 四 条 指令 ，PDU 就 只 读 取 当前 块 中 剩余 的 指令 。 

PDU 使 用 4 状态 转移 预测 算 靶 ， 与 图 8-15 的 描述 类 似 。 它 利用 转移 指令 中 的 转移 预测 位 将 初 
始 状态 设置 为 LT 或 LNT。 对 于 高 速 缓 存 中 的 每 两 条 指令 ，PDU 用 两 位 来 记录 转移 预测 算法 的 状 
态 。 这 些 位 存储 在 高 速 缓存 与 该 指令 相关 的 标志 中 。 

对 于 指令 高 速 缓存 中 的 每 四 条 指令 ， 提 供 了 称 为 Next Address 的 标志 字段 。 当 执行 最 先 取出 
的 指令 时 ，PDU 计 算 转 移 指令 的 目标 地 址 ， 并 将 该 地 址 记录 在 Next Address 字 段 中 。 这 个 字段 使 
得 在 以 后 的 步 又 中 不 必 每 次 重新 计算 目标 地 址 ， 就 可 以 继续 预 取 指 令 。 由 于 每 半 条 高 速 缓存 线 
只 有 一 个 Next Address 字 段 ， 所 以 只 有 在 每 组 的 四 条 指令 中 最 多 有 一 -条 转移 指令 的 情况 下 ， 它 的 
优点 才能 充分 体现 出 来 。 

分 组 

在 流水 线 的 第 3 段 G 中 ， 分 组 逻辑 选择 要 并 行 执 行 的 一 组 最 多 四 条 指令 ， 将 它们 调度 到 整数 
和 浮 点 执行 部 件 中 。 图 8-25 所 示 为 一 个 简短 的 指令 序列 以 及 这 些 指令 要 调度 的 方法 。 该 图 的 b 部 
分 和 c 部 分 是 分 别 表示 PDU 预 测 发 生 转 移 和 不 发 生 转 移 时 的 指令 分 组 情况 。 注 意 ， 延 迟 模 中 的 指 
令 FCMP 在 这 两 种 情况 下 都 包括 在 选 定 的 组 中 。 该 指令 将 被 执行 ， 但 直到 做 出 转移 决策 时 才 会 提 
交 。 如 果 发 生 转 移 ，FCMP 的 结果 就 是 无 效 的 ， 因 为 转移 指令 的 无 效 位 被 置 为 1。 每 组 的 前 两 条 
指令 调度 到 整数 部 件 ， 后 两 条 指令 调度 到 浮 点 部 件 。 

分 组 逻辑 电路 负责 确保 它 调度 的 指令 是 已 经 准备 就 绪 的 指令 。 例 如 ， 在 一 个 组 中 指令 使 用 
的 所 有 操作 数 必 须 都 已 经 准备 好 。 如 果 一 条 指令 依赖 另 一 条 指令 的 结果 ， 那 么 这 两 条 指令 不 能 
分 在 同一 组 中 。 转 移 指令 不 包含 在 这 个 条 件 中 ， 下 面 将 简要 解释 。 

指令 按 程序 的 顺序 调度 。 回 想 一 下 如 果 分 组 中 包括 转移 指令 ， 由 于 预 取 和 译 码 部 件 的 转移 
预测 ， 转 移 指令 就 会 已 经 尝试 着 被 执行 了 。 因 此 ， 基 于 这 种 预测 ， 指 令 缓冲 器 中 的 指令 就 会 以 
正确 的 次 序 执行 。 分 组 逻辑 按 顺 序 对 指令 缓冲 器 中 的 指令 做 简单 检查 ， 目 的 是 在 队 首选 择 出 满 
足 分 组 约束 的 最 大 数 。 

分 组 逻辑 在 挑选 要 包括 在 分 组 中 的 指令 时 ， 要 考虑 的 一 些 约束 有 : 

1. 指令 只 能 按 顺 序 调度 。 如 果 一 条 指令 不 包括 在 组 中 ， 那 么 其 后 的 所 有 指令 都 不 能 被 选择 ， 

2. 同一 组 中 ， 一 条 指令 的 源 操作 数 不 能 依赖 于 任何 其 他 指令 的 目标 操作 数 。 这 条 规则 有 两 
项 例外 : 





R3, R4, R7 R7 - [R3] + [R4] 
设置 条 件 码 

Label 如 果 为 0 转移 ， 将 取消 位 置 1 

F1, F5 FP: 比较 [F2] 和 [F5] 

F2, F3, F6 FP: F6- [F2] + [F3] 


F3, F4 将 单 精度 操作 数 从 F3 移 动 到 F4 


F2, F3, F6 FP: R6% [F2] ~ [F3] 
R3, R4, R7 将 [R3] + [RAAE A 4k A R7 





a) 程序 片断 


R3, R4, R7 
Label 
F1, F5 
F2, F3, F6 





b) 发 年 转移 时 的 指令 分 组 


ADDcc R3, R4, R7 
BRZ,a Label 


FCMP R1, R5 
FADD R2, R3, R6 





c) 不 发 生 转移 时 的 指令 分 组 
图 8-25 指令 分 组 实例 


“ 将 寄存 器 的 内 容 存 到 存储 器 的 存储 指令 可 以 与 前 面 使 用 该 寄存 器 作为 目标 寄存 器 的 指 
令 分 为 一 组 。 这 是 允许 的 ， 因 为 流水 线 直到 以 后 存储 指令 阶段 时 才 需 要 数据 。 下 面 会 
看 到 这 种 情形 。 | 
。 转 移 指令 可 能 与 前 面 设置 条 件 码 的 指令 分 为 一 组 。 

3. 同一 组 中 的 两 条 指令 不 能 有 相同 的 目标 操作 数 ， 除 非 目标 操作 数 是 寄存 器 RO。 例 如 ， 图 

8-26a 中 的 LDSW 指 令 不 能 与 ADD 指 令 分 为 一 组 ， 应 延迟 到 下 一 组 中 ， 如 图 所 示 。 
4 在 一 些 情形 下 ， 某 些 指令 相对 于 其 他 指令 必须 延迟 两 到 三 个 时 钟 周期 。 例 如 ， 条 件 指令 
MOVRZ RI, R6,R7 


(根据 寄存 器 的 情况 传送 ) 如 果 R1 的 内 容 等 于 0， 就 将 R6 的 内 容 传送 到 R7。 这 条 指令 需要 一 个 额 
外 的 时 钟 周期 来 检查 R1 的 内 容 是 否 等 于 0。 因 此 ， 读 寄存 器 R7 的 指令 不 能 分 在 同一 组 或 随后 的 
组 中 。 此 类 指令 的 最 早 调度 如 图 8-26b 所 示 。 

当 分 组 逻辑 将 指令 调度 到 整数 部 件 时 ， 它 也 同时 从 整数 寄存 器 文件 中 取出 那 条 指令 的 源 操 
作 数 。 访 问 寄 存 器 文件 所 需要 的 信息 在 译 码 位 中 可 以 得 到 。 译 码 位 由 预 取 译 码 部 件 送 入 指令 组 
冲 器 。 所 以 ， 到 G 段 的 时 钟 周期 末 ， 有 一 条 或 两 条 整数 指令 准备 就 绪 可 进入 执行 阶段 。 从 寄存 器 
文件 读 到 的 数据 存 人 中 间 存 储 缓冲 器 ， 如 图 8-27 所 示 。 指 令 传送 到 浮 点 部 件 后 ， 在 R 段 存 取 浮 点 
寄存 器 文件 中 的 操作 数 。 
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ADD R3, R5, R6 G E C N N N W 
LDSW R4, R7, R6 G E C N N N W 


a) 有 公共 目标 操作 数 的 指令 


MOVRZ RI, R6, R7 G E C N N N W 
OR R7, R8, R9 G E C N N N W 


b) 由 MOVR 指 令 引起 的 延迟 
图 8-26 由 于 阻塞 的 调度 延迟 


段 间 缓 冲 器 


IEUO 


IEUI 





图 8-27 整数 执行 部 件 


执行 部 件 

整数 执行 部 件 包括 两 个 相似 但 不 同 的 部 件 IEU0 和 IEU1。 只 有 部 件 IEU0 能 够 处 理 移 位 指令 ， 
同时 只 有 IEU1 能 够 产生 条 件 码 。 不 涉及 这 两 种 操作 的 指令 可 以 在 任何 一 个 部 件 上 执行 ， 

大 多 数 整数 指令 的 ALU 操 作 都 在 一 个 时 钟 周 期 内 完成 ， 即 流水 线 的 E 阶 段 。 在 这 个 时 钟 周期 
末 ， 将 结果 保存 在 如 图 8-27 所 示 的 ALU 输 出 端的 缓冲 器 中 。 在 下 一 个 时 钟 周 期 C 段 ， 该 缓冲 器 的 
内 容 传送 到 寄存 器 文件 的 Annex 部 分 中 。Annex 中 包含 着 用 于 寄存 器 重 命名 的 临时 寄存 器 ， 这 在 
8.6 节 阐述 过 。 在 流水 线 的 W 段 ， 临 时 寄存 器 的 内 容 传送 到 相应 的 永久 寄存 器 中 。 

在 C 段 的 另 一 个 动作 是 产生 条 件 码 。 当 然 ， 只 有 指定 要 设置 条 件 码 标志 位 的 指令 ， 例 如 
ADDcc, 才 会 产生 条 件 码 。 这 类 指令 必须 在 IEU1 部 件 中 执行 。 

考虑 设置 条 件 码 标志 的 Icc 指 令 以 及 检查 这 些 标志 位 的 后 续 条 件 转移 指令 BRecc。 当 预 取 和 调 
度 部 件 遇 到 BRcc 指 令 时 ， 可 能 还 没有 得 到 Icc 执 行 的 结果 。PDU 预 测 转移 结果 在 此 基础 上 继续 预 
取 指 令 。 稍 后 ， 当 Icc 到 达 流 水 线 的 C 段 时 产生 条 件 码 ， 并 且 在 同一 时 钟 周期 将 条 件 码 送 到 PDU。 
PDU 检 查 它 的 转移 预测 是 否 正 确 。 如 果 正 确 ， 继 续 执行 而 不 用 中 断 。 否 则 、 清 除 流水 线 和 指令 
缓冲 器 的 内 容 ，PDU 重 新 取出 正确 指令 。 因 为 这 些 指令 还 未 到 达 流 水 线 的 W 段 ， 所 以 可 以 在 此 





处 清除 。 

当 转 移 预 测 不 正确 时 ， 可 能 已 错误 地 预 取 并 部 分 地 执行 了 许多 指令 。 这 种 情形 如 图 8-28 所 
示 。 我 们 假定 分 组 逻辑 在 三 个 连续 时 钟 周期 调度 四 条 指令 。 指 令 Icc 在 第 一 组 的 开始 设置 了 条 件 
码 ， 谍 条 件 码 由 随后 的 BRcc 指 令 测试 。 当 第 一 组 到 
达 C 段 时 进行 该 测试 。 这 时 ， 第 三 组 js 到 I 进入 流水 Iı (Ico) 
线 的 G 段 。 如 果 转 移 预测 不 正确 ， 那 么 将 取消 1 到 | P ERO 
0 的 九条 指令 (注意 延迟 槽 中 的 指令 0 总 是 被 执行 
的 )。 此 外 ， 可 能 已 经 预 取 并 装 入 指令 缓冲 器 中 的 
其 他 指令 也 要 被 丢弃 。 因此， 在 极限 情形 下 ， 可 能 
会 丢 奔 21 条 指令 。 

在 流水 线 的 N1 和 N2 段 ， 不 能 执行 任何 操作 。 
所 以 在 这 两 个 段 引 入 两 个 时 钟 周期 的 延迟 ， 使 得 整 
数 流水 线 的 整个 长 度 与 浮 点 流水 线 的 长 度 相 同 。 对 
于 在 C 段 没有 执行 完 的 整数 指令 ， 例 如 除法 指令 ， . 
在 N1 和 N2 段 继续 执行 。 如 果 需 要 更 多 的 时 间 ， 则 图 8-28 错误 转移 预测 最 差 情 形 下 的 时 序 
在 N1 和 N2 之 闻 插 入 额外 时 钟 周期 。 指 令 只 有 在 执行 的 最 后 一 个 时 钟 周期 才 进 入 N2。 例 如 ， 如 果 
执行 一 条 指令 操作 需要 16 个 时 钟 周期 ， 则 需要 在 N1 段 之 后 插入 12 个 时 钟 周期 。 

浮 点 执行 部 件 也 有 两 个 独立 的 流水 线 。 在 R 段 读 取 寄存 器 操作 数 ， 该 操作 经 历 三 个 流水 线段 
(X1 到 X3) 完成 。 这 里 如 果 需 要 额外 的 时 钟 周 期 ， 例 如 求 平方 根 指令 ， 要 在 X2 和 X3 之 间 插 入 额 
外 的 时 钟 周期 。 

在 N3 段 ， 处 理 器 检查 各 种 异常 条 件 来 判定 是 否 会 发 生 陷阱 CHW). RS, EZAR 
(W) ,指令 的 结果 保存 在 目标 单元 (一 个 寄存 器 或 数据 高 速 缓存 ) 中 。 在 进入 此 段 之 前 的 任何 时 
刻 ， 指 令 都 可 能 被 清除 ， 并 且 指 令 的 所 有 作用 都 被 取消 。 一 旦 进入 写 阶段 ， 指 令 的 执行 就 不 能 
停止 了 。 

读 取 和 存储 部 件 

指令 
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C 
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G 
G 
G 
G 


LDUW R5, R6, R7 


从 存储 器 的 [R5]+[R6] 单 元 处 将 32 位 无 符号 字 取 到 寄存 器 R7 中 。 对 于 其 他 整数 指令 ， 在 洗 水 线 的 
G 段 期 间 读 取 寄存 器 R5 和 R6 的 内 容 。 然 而 ， 指 令 和 指令 操作 数 并 不 是 送 入 其 中 一 个 整数 执行 部 
件 中 ， 而 是 转发 到 读 取 和 存储 部 件 中 ， 如 图 8-29 所 示 。 在 E 段 ， 该 部 件 通 过 把 寄存 器 R5 和 R6 的 
内 容 相 加 来 产生 要 访问 的 存储 单元 的 有 效 地 址 。 这 个 结果 是 一 个 虚拟 地 址 值 ， 它 被 送 入 数据 高 
速 缓存 中 ， 同 时 送 入 数据 转换 缓冲 器 dTLB 中 准备 转换 成 物理 地 址 。 

数据 按 虚拟 地 址 存 和 高速 缓存 中 , 因而 无 须 等 待 地 址 转换 结束 就 可 以 迅速 访问 数据 。 ECR, 
数据 和 相应 的 标志 信息 都 从 D-Cache 中 读 出 ， 物 理 地 址 从 dTLB 中 读 出 。D-Cache 中 用 的 标志 是 物 
理 地 址 数据 的 一 部 分 。 在 N1 段 ， 从 D-Cache 中 读 出 的 标志 与 从 dTLB 得 到 的 物理 地 址 相 核 对 。 命 
中 时 ， 数 据 取 和 Annex 寄 存 器 中 ， 在 W 段 送 到 目标 寄存 器 。 如 果 标 志 不 匹配 ， 指 令 进入 读 取 / 存 
储 队 列 ， 在 那里 等 待 从 外 部 高 速 缓存 读 人 D-Cache 中 的 高 速 缓存 块 。 

一 旦 指令 进入 读 取 /存储 队列 ， 就 不 再 认为 它 是 在 执行 流水 线 中 了 。 当 一 条 装 人 指令 正在 队 
列 中 等 待 时 ， 其 他 指令 可 以 继续 执行 直到 完成 ， 除 非 其 中 某 条 指令 引用 了 正 等 待 存储 器 数据 的 
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寄存 器 《上 例 的 R7)。 因 此 ， 读 取 / 存 储 队列 使 流水 线 操作 从 外 部 数据 存 取 操作 中 分 离 出 来 ， 以 
便 这 两 个 操作 可 以 独立 执行 。 





读 取 / 存 储 队 列 


NI 
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整数 寄存 器 
文件 /annex 


图 8-29 读 取 和 存储 部 件 


执行 流程 

分 析 UltraSPARC H 处 理 器 中 以 及 UltraSPARC I 处 理 器 与 外 部 高 速 缓存 和 存储 器 之 间 的 指令 
和 数据 流 是 有 意义 的 。 图 8-30 是 图 8-23 重 新 组 织 后 的 主要 功能 部 件 , 它 用 来 说 明 指 令 流 和 数据 流 ， 
以 及 指令 和 数据 队列 所 起 的 作用 。 

指令 从 LCache 中 取出 并 装 到 指令 缓冲 器 中 ， 指 令 缓冲 器 可 以 存储 12 条 指令 。 从 那里 ， 每 次 
将 四 条 指令 传送 到 称 为 “内 部 寄存 器 和 执行 部 件 ”的 模块 中 ， 指 令 在 那里 被 执行 。 一 般 ，PDU 
填 满 指令 缓冲 器 的 速度 高 于 分 组 逻辑 调度 指令 的 速度 。 因 此 ， 指 令 缓冲 器 大 部 分 时 间 是 满 的 。 
设 有 高 速 缓存 失效 及 转移 预测 错误 时 ， 内 部 执行 部 件 永远 不 会 缺乏 指令 。 类 似 地 ， 在 大 部 分 时 
间 里 ， 读 取 和 存储 指令 的 内 存 操作 数 可 能 在 数据 高 速 缓 存 中 找到 ， 所 以 用 一 个 时 钟 周期 就 可 以 
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进行 存 取 操 作 。 因 此 执行 可 以 正常 进行 而 没有 延迟 。 

当 指 令 高 速 缓存 失 效 时 ， 从 外 部 高 速 缓存 中 读 取 正 确 的 块 需要 几 个 时 钟 周期 的 延迟 。 这 期 
间 ， 分 组 逻辑 继续 从 指令 缓冲 器 中 调度 指令 直到 缓冲 器 为 空 。 根 据 处 理 器 模型 不 同 ， 可 能 要 用 
三 或 四 个 时 钟 周 期 从 外 部 高 速 缓存 中 读 取 高 速 缓 存 块 ( 八 条 指令 )。 这 个 时 间 与 分 组 逻辑 在 满 指 
令 的 缓冲 器 中 调度 指令 所 用 的 时 间 基 本 相同 (注意 在 每 个 时 钟 周 期 并 不 是 总 能 调度 四 条 指令 )。 
因此 ， 如 果 发 生 高 速 缓 存 失 效 时 指令 缓冲 器 是 满 的 ， 流 水 线 的 执行 操作 可 能 根本 不 会 中 断 。 如 
果 外 部 高 速 缓存 也 发 生 失 效 ， 就 需要 更 多 的 时 间 来 访问 存储 器 。 在 这 种 情形 下 ， 难 免 会 发 生 流 
水 线 的 拖延 。 
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图 8-30 执行 流程 


造成 高 速 缓存 失效 的 取 操 作 进 入 存 取 队 列 并 等 待 从 外 部 高 速 缓存 或 存储 器 中 传送 数据 。 然 
而 ， 只 要 取 操 作 的 目标 寄存 器 没有 被 后 面 的 指令 引用 ， 内 部 指令 就 可 以 继续 执行 。 因 此 ， 指 令 
缓冲 器 和 存 取 队列 把 内 部 处 理 器 流水 线 从 外 部 数据 传输 中 隔离 出 来 。 它 们 作为 一 种 弹性 接口 ， 
在 慢 速 外 部 数据 传输 的 同时 允许 继续 运行 内 部 的 高 速 流 水 线 。 


8.8 性 能 考虑 


我 们 在 1.6 节 指出 过 拥有 动态 指令 数 N 的 程序 执行 时 间 T 由 公式 
NxS 
R 
给 出 ， 其 中 5 是 读 取 和 执行 一 条 指令 所 用 时 钟 周期 的 平均 数 ，R 是 时 钟 频率 。 这 个 简单 模型 假设 
指令 是 按照 一 条 接着 一 条 执行 的 ， 中 间 没 有 重 又 。 一 个 有 用 的 性 能 指标 是 指令 吞吐 量 ， 它 是 每 
秒 执行 指令 的 数量 。 对 于 顺序 执行 ， 吞吐 县 由 


T= 








An 
© 
D 
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Ps= R/S 


给 出 。 

本 节 中 ， 我 们 来 了 解 流 水 线 对 指令 吞吐 量 的 提高 程度 。 不 过 应 再 强调 一 点 在 第 1! 章 中 提出 的 
关于 性 能 的 度量 。 度 量 性 能 的 惟一 实际 量 是 程序 的 整个 执行 时 间 ， 如 果 指 定 的 任务 需要 执行 大 
量 的 指令 ， 那 么 较 高 的 指令 吞吐 量 也 不 一 定 会 带 来 高 性 能 。 由 于 这 个 原因 ， 在 比较 两 个 处 理 器 
时 ,第 1 章 描述 的 SPEC 速 率 提供 了 一 个 较 好 的 衡量 指标 。 

图 8-2 说 明 4 段 流水 线 可 以 使 指令 吞吐 量 提高 4 售 。 通 常 ，n 段 流水 线 可 以 将 吞吐 量 提 高 4 倍 。 
因此 ， 似 乎 " 值 越 高 ， 得 到 的 性 能 就 越 强 。 这 会 引起 两 个 问题 : 

* 指令 吞吐 量 的 潜在 提高 实际 上 能 实现 多 少 ? 

“7 值 最 好 为 多 少 ? 

只 要 流水 线 出 现 阻 塞 ， 指 令 吞 吐 量 就 会 降低 。 因 此 ， 流 水 线 的 性 能 大 大 受到 诸如 转移 和 高 速 组 
存 失 效 代价 等 因素 的 影响 。 首 先 ， 我 们 讨论 这 些 因 素 对 性 能 的 影响 ， 然 后 讨论 应 该 采用 多 少 流 
水 线段 的 问题 。 


8.8.1 指令 阻塞 的 影响 


在 前 几 节 已 经 定性 地 介绍 了 各 种 阻塞 的 影响 。 现 在 我 们 定量 地 评估 一 下 高 速 缓存 失效 和 转 
移 代 价 的 影响 。 考 虑 一 个 使 用 图 8-2 中 的 4 段 流水 线 的 处 理 器 。 时 钟 频率 ， 也 就 是 分 配给 流水 线 
中 每 段 的 时 间 ， 由 最 长 的 段 决定 。 设 通过 ALU 的 延迟 为 临界 参数 。 它 是 两 个 整数 相 加 所 需要 的 
时 间 。 因 此 ， 如 果 ALU 延 迟 是 2ns， 可 使 用 00MHz 时 钟 。 这 个 处 理 器 片上 的 指令 和 数据 高 速 组 
存 也 应 该 将 它们 的 存 取 时 间 设 计 为 2ns。 在 理想 条 件 下 ， 这 个 流水 线 处 理 器 的 指令 吞吐 量 已 由 

` P,=R=500MIPS (每 秒 百 万 指令 数 ) 
给 出 。 
为 了 评价 高 速 缓存 失效 的 影响 ， 我 们 使 用 与 在 5.6.2 节 同样 的 参数 。 在 该 系统 中 高 速 缓存 失 
BARM 计算 出 来 为 17 个 时 钟 周期 。 设 五 是 完成 两 条 连续 指令 之 间 的 时 间 。 对 于 顺序 执行 , Ti=5。 
然而 ， 在 没有 阻塞 时 ， 流 水 线 处 理 器 每 时 钟 周 期 执行 完 一 条 指令 ， 因 此 T= 1 周期 。 高 速 绥 存 类 
效 使 流水 线 延迟 的 时 间 等 于 高 速 缓存 失效 的 代价 。 这 意味 着 Ti 增加 的 数量 值 等 于 高 速 缓 存 失 效 
时 指令 的 高 速 缓存 失效 代价 。 发 生 高 速 缓存 失效 可 能 是 由 指令 或 数据 引起 的 。 考 虑 一 台 指令 和 
数据 共享 高 速 缓存 的 计算 机 ， 设 d 是 与 内 存 操 作 数 有 关 的 指令 的 百分比 。 由 于 高 速 缓存 失效 使 Ti 
的 值 平均 提高 的 结果 由 下 式 给 出 : 
Ó... =((1-h)+d(— h,)) x M, 
其 中 心 和 各 分 别 是 指令 和 数据 的 命中 率 。 假 设 30% 的 指令 访问 存储 器 中 的 数据 。 当 指令 命中 率 为 
95% ， 数 据 命中 率 为 90% 时 ， 
Ô miss = (0.05 + 0.3 x 0.1) x 17 = 1.36 周 期 
将 这 个 延迟 考虑 进来 ， 那 么 处 理 器 的 吞吐 量 为 
R R 

注意 ，R 用 MHz 表示 ， 直 接 得 到 的 吞吐 量 是 每 秒 百 万 条 指令 。 当 R = 500MHz 时 ，P，,= 210MIPS。 


= 0.42R 
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将 这 个 值 与 没有 流水 线 得 到 的 吞吐 量 相 比 较 。 使 用 顺序 执行 的 处 理 器 每 条 指令 需要 4 个 周期 。 
它 的 吞吐 量 为 
R 


P = =0.19R 
` 4+0 


当 R = 500MHz 时 ，P, = 95MIPS。 很 明显 大 大 提高 了 流水 线 的 吞吐 量 。 但 是 性 能 增益 
0.42/0.19 = 2.2， 只 是 理想 情形 的 一 半 多 一 点 。 

在 流水 线 处 理 器 中 降低 高 速 缓存 失效 代价 尤其 重要 。 正 如 在 第 5 章 中 阐述 的 ， 这 可 以 通过 在 
片上 高 速 缓存 和 存储 器 之 间 引 入 第 二 级 高 速 缓存 来 实现 。 假 设 从 第 二 级 高 速 缓存 传送 一 个 8 个 字 
的 块 需要 的 时 间 是 10as。 因 此 ， 如 果 主 高 速 缓存 失效 ， 在 第 二 级 高 速 缓存 中 存在 所 需要 块 时 ， 
将 会 引入 5 个 周期 的 代价 M,。 在 第 二 级 高 速 缓 存 失效 的 情形 下 , 会 带 来 总 共 17 个 周期 的 代价 (My ) 。 
因此 ， 假 设 第 二 级 高 速 缓存 的 命中 率 为 94%，T 平 均 提 高 

ó. =(Q-A) +a- h,))x (h, x M, +0- h,)x M,) = 0.46 JJ] 
这 种 情形 下 的 指令 吞吐 量 为 0.68R 或 340MIPS。 等 价 的 非 流水 线 处 理 器 吞吐 量 为 0.22R 或 110MIPS。 
` 因此， 流水 线 提 供 的 性 能 增益 为 0.68/0.22 = 3.1。 

事实 上 ，1.36 和 0.46 的 值 是 有 点 斐 观 ， 因 为 我 们 假设 每 次 发 生 数据 失效 时 会 带 来 全 部 的 失效 
代价 。 而 这 只 是 当 处 理 器 等 待 存储 器 访问 结束 时 ， 紧 跟 在 访问 存储 器 指令 之 后 的 那 条 指令 被 延 
述 的 情形 。 然 而 ， 优 化 编译 器 会 尽力 在 产生 依赖 性 的 两 条 指令 之 间 放 入 其 他 指令 来 增加 距离 。 
而 且 ， 在 使 用 指令 队列 的 处 理 器 中 ， 在 取 指 令 期 间 ， 由 于 处 理 器 能 够 从 队列 中 调度 指令 ， 所 以 
高 速 缓存 失效 代价 的 影响 会 大 大 降低 。 


8.8.2 流水 线 的 段 数 


n 段 流水 线 可 以 使 指令 吞吐 量 提 高 4 倍 的 事实 促使 我 们 使 用 大 量 的 流水 线段 。 然 而 ， 随 着 流 
水 线段 数 的 增加 ， 流 水 线 延迟 的 概率 也 会 相应 增加 ， 因 为 会 有 更 多 的 指令 并 发 地 执行 。 因 此 ， 
相距 很 远 的 指令 之 间 的 依赖 性 还 可 能 会 引起 流水 线 的 延迟 。 而 且 ， 转 移 代 价 可 能 会 变 得 更 大 ， 
如 图 8-9 所 示 。 由 于 这 些 原 因 ，zx 值 增加 所 带 来 的 增益 开始 减 小 ， 相 关 的 开销 也 就 不 再 合理 了 。 

男 一 个 重要 因素 是 处 理 器 执行 中 基本 操作 的 固有 延迟 ， 其 中 最 重要 的 是 ALU 延 迟 。 在 许多 
处 理 器 中 ， 处 理 器 将 完成 一 项 ALU 操 作 的 时 间 当 作 一 个 时 钟 周 期 的 大 小 。 其 他 操作 按照 加 法 操 
作 所 用 的 时 间 分 成 几 步 。 对 于 使 用 流水 线 的 ALU 这 种 方法 也 是 可 行 的。 例如 ，Compaq Alpha 
21064 处 理 器 的 ALU 包 括 2 段 流水 线 ， 每 段 用 5ns 完 成 它 的 操作 。 

许多 流水 线 处 理 器 使 用 4 到 6 个 段 。 另 外 一 些 处 理 器 将 指令 执行 分 成 更 小 的 段 ， 使 用 更 多 的 
流水 线段 数 以 及 更 快 的 时 钟 。 例 如 ，UltraSPARC II 使 用 9 段 流水 线 ，Intel 的 PentiumPro 使 用 12 段 
流水 线 。 最 新 的 Intel 处 理 器 Pentium4 有 一 条 20 段 的 流水 线 ， 使 用 的 时 钟 频率 范围 在 1.3~1.5GHz。 
为 了 快速 操作 ， 一 个 时 钟 周期 内 可 以 存在 两 个 流水 线段 。 


8.9 结束 语 


本 章 介绍 了 两 个 重要 特性 : 流水 线 和 指令 多 发 。 流 水 线 使 我 们 能 够 设计 出 指令 吞吐 量 达 到 
每 个 时 钟 周期 一 条 指令 的 处 理 器 。 多 发 使 得 指令 吞吐 量 为 每 个 时 钟 周 期 有 多 条 指令 的 超标 量 操 
作成 为 可 能 。 
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只 有 认真 解决 以 下 三 个 方面 的 问题 ， 才 可 以 实现 性 能 的 提高 : 
* 处 理 器 的 指令 集 

“流水线 硬件 的 设计 

* 相关 编译 器 的 设计 


认识 到 三 者 之 间 的 相互 作用 是 非常 重要 的 。 在 一 个 处 理 器 的 设计 过 程 中 ， 由 于 对 这 三 者 之 间 相 
互 作用 的 认识 程度 不 同 ， 设 计 出 来 的 处 理 器 性 能 水 平 也 不 同 。 重 视 程度 越 高 ， 处 理 器 的 性 能 水 
平 就 越 高 。 对 于 现代 处 理 器 来 说 ， 特 别 适 用 流水 线 执行 的 指令 集 是 它 的 关键 特征 。 


习题 

8.1 考虑 下 列 指令 序列 
Add #20, RO, R1 
Mul #3, R2, R3 
And #$3A, R2, R4 
Add RO, R2, R5 


8.2 


8.3 


8.4 


8.5 


8.6 


8.7 


在 所 有 指令 中 ， 目 标 操作 数 在 最 后 给 出 。 寄 存 器 RO 和 R2 的 初始 值 分 别 为 2000 和 50。 这 些 指 
令 在 包含 有 类 似 于 图 8-2 所 示 的 4 段 流水 线 上 执行 。 假 设 在 第 1 个 时 钟 周期 取 第 1 条 指令 ， 并 
且 取 第 1 条 指令 只 需 1 个 时 钟 周 期 。 
(a) 画 出 类 似 于 图 8-2a 的 图 。 描 述 在 第 1 到 第 4 个 时 钟 周期 的 每 一 个 周期 中 流水 线 中 每 一 段 实 
现 的 操作 ， 
(b) 写 出 第 2 到 第 5 时 钟 周期 中 中 间 存 储 缓 冲 器 B1、B2 和 B3 的 内 容 。 
针对 下 列 程序 

Add #20, RO,R!1 

Mul #3, R2, R3 

And #$3A, R1, R4 

Add RO, R2, R5 
重新 回答 8.1 中 的 问题 。 
图 8-6 中 的 指令 由 于 依赖 于 5 的 结果 而 延迟 。 通 过 占用 译 码 段 ， 指 令 D 阻 塞 D, L 进而 又 阻塞 
Lo LML 不 依赖 于 I 或 I ， 并 且 寄 存 器 文件 允许 两 步 写 并 行进 行 ， 如 何 利用 附加 的 存储 
缓冲 器 使 和 EK 比 图 8-6 中 所 示 早 一 些 进行 处 理 ? 重新 画图 ， 指 出 各 步 的 新 次 序 。 
图 8-6 中 产生 延迟 气 袍 是 因为 指令 D 在 译 码 段 延迟 ， 由 此 导致 了 指令 I ML 被 延迟 ， 即 使 B 和 
L 不 依赖 于 I 或。 假设 译 码 段 允许 两 步 译 码 并 行进 行 。 证 明 如 果 寄 存 器 文件 也 允许 两 个 写 
步 又 并 行进 行 ， 可 以 完全 消除 延迟 气泡 。 
图 8-4 给 出 了 一 条 指令 因 高 速 缓存 失效 而 引起 的 延迟 。 用 图 8-10 的 硬件 结构 重 画 此 图 。 假 设 
指令 队列 可 容纳 四 条 指令 ， 并 且 取 指令 部 件 一 次 从 高 速 缓存 中 读 两 条 指令 。 
一 个 循环 程序 以 一 条 转移 到 循环 开始 的 条 件 转移 语句 结束 。 如 何在 使 用 包含 有 延迟 槽 的 延 
迟 转移 的 流水 线 计算 机 上 实现 这 个 循环 ? 在 什么 条 件 下 能 够 将 有 效 指令 放 到 延迟 档 中 ? 
UltraSPARC I 处 理 器 的 转移 指令 有 一 个 无 效 位 。 当 被 编译 器 设置 时 ， 如 果 不 发 生 转 移 就 
丢弃 延迟 槽 中 的 指令 。 一 种 替代 方法 是 如 果 发 生 转 移 就 委 弃 该 指令 。 何 时 选择 使 用 这 两 
种 方法 ? 
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88 一 台 计 算 机 有 一 个 延迟 档 。 延 迟 槽 中 的 指令 总 会 被 执行 ， 但 这 只 是 在 纯 理 论 的 基础 上 。 如 
果 转 移 不 发 生 ， 这 条 指令 的 结果 被 丢弃 。 提 出 一 种 在 这 台 计 算 机 上 有 效 地 实现 循环 程序 的 
方法 。 

8.9 为 SPARC 处 理 器 重 写 图 2-34 的 排序 程序 。 注意 SPARC 体 系 结构 有 一 个 含有 相关 无 效 位 的 延 
迟 档 并 使 用 转移 预测 。 尽 量 用 有 效 指令 填充 延迟 槽 。 

8.10 考虑 一 个 语句 格式 

IF A>B THEN 动作 1 ELSE 动作 2 


的 描述 。 写 一 个 汇编 语言 指令 序列 ， 首 先 只 使 用 转移 指令 ， 接 着 使 用 如 同 在 ARM 处 理 器 
上 提供 的 那些 条 件 指令 。 假 设 使 用 一 条 简单 的 2 段 流水 线 ， 画 出 类 似 于 图 8-8 的 图 用 来 比较 
两 种 方法 的 执行 时 间 。 

8.11 图 8-7 中 的 前 馈 通路 ( 粗 线 ) 允许 RSLT 寄 存 器 的 内 容 直 接 在 ALU 中 使 用 。 运 算 的 结果 存 回 
到 RSLT 寄 存 器 中 ， 并 替换 它 先前 的 内 容 。 使 用 什么 类 型 的 寄存 器 可 以 使 这 种 运算 成 为 可 
能 ? 
考虑 两 条 指令 

lı: Add R1,R2,R3 

L: Shift_left R3 
假设 在 指令 I 执行 前 ，R1、R2、R3 和 RSLT 的 值 分 别 为 30、100、45 和 198。 画 出 一 条 4 段 流 
水 线 的 时 序 图 ， 在 每 个 周期 标 出 时 钟 信号 和 RSLT 寄 存 器 的 内 容 。 用 你 所 画 的 图 证 明 转 发 
操作 可 以 得 到 正确 的 结果 。 

8.12 为 一 个 处 理 器 写 一 个 如 图 2-37 的 程序 ,在 该 处 理 器 中 只 有 读 取 和 存储 指令 可 以 访问 存储 器 。 
标 出 程序 中 的 所 有 依赖 性 ， 并 指出 如 何 优化 该 程序 以 便 在 流水 线 处 理 器 上 执行 。 

8.13 假设 在 计算 机 上 执行 的 动态 指令 数 的 20% 是 转移 指令 。 使 用 包含 有 一 个 延迟 槽 的 延迟 转移 
估计 出 性 能 的 增益 ， 假 设 编译 器 能 够 使 用 延迟 槽 的 85% 。 

8.14 一 个 流水 线 处 理 器 包含 有 两 个 转移 延迟 槽 。 一 个 优化 编译 器 能 够 占 满 其 中 一 个 延迟 槽 85% 
的 时 间 ， 另 一 个 只 有 20% 。 这 种 优化 使 性 能 提高 的 百分比 是 多 少 ?假设 所 执行 指令 的 20% 
是 转移 指令 。 

8.15 一 个 流水 线 处 理 器 使 用 延迟 转移 技术 。 请 你 从 这 种 处 理 器 的 两 种 可 能 设计 中 推荐 一 种 。 在 
第 一 种 可 能 性 中 ， 处 理 器 拥有 一 条 4 段 流水 线 和 一 个 延迟 槽 ， 在 第 二 种 可 能 性 中 ， 它 拥有 
一 条 6 段 流 水 线 和 两 个 延迟 模 。 比 较 这 两 种 方案 的 性 能 ， 只 考虑 转移 代价 。 假 设 20% 的 指 
令 是 转移 指令 并 且 优 化 编译 器 填 满 单个 延迟 槽 的 成 功率 是 80%。 对 于 第 二 种 方案 ， 编 译 器 
能 填 满 第 二 个 延迟 槽 25% 的 时 间 。 

8.16 考虑 一 个 使 用 图 8-15b 表 示 的 转移 预测 机 制 的 处 理 器 。 初 始 状态 是 LT 或 LNT， 这 取决 于 转 
移 指令 所 提供 的 信息 。 讨 论 编译 器 应 如 何 处 理 用 于 控制 “do while” # “do until” 循 环 的 
转移 指令 ， 并 讨论 每 一 种 情形 下 转移 预测 机 制 的 适用 性 。 

8.17 假设 图 8-10 的 指令 队列 可 容纳 六 条 指令 。 重 画图 8-11， 假 设 队 列 在 时 钟 周期 1 是 满 的 ， 并 且 
取 指 令 部 件 一 次 能 从 高 速 缓存 中 读 两 条 指令 。 在 指令 被 取出 后 ， 队 列 什么 时 候 再 次 被 填 
满 ? 

8.18 针对 图 8-14 中 转移 预测 错误 的 情形 重 画 图 8-11。 

8.19 图 8-16 给 出 了 使 用 复合 寻 址 方式 的 指令 用 相同 的 时 间 来 执行 使 用 简单 寻 址 方式 的 一 个 等 价 
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指令 序列 。 然 而 ， 使 用 简单 寻 址 方式 是 RISC 设 计 思 想 的 一 个 原则 。 你 如 何 设计 一 条 流水 线 
来 处 理 复 合 寻 址 方式 ? 讨论 这 种 方法 的 利弊 。 
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第 9 章 


其 入 式 系统 


本 章 目标 


在 本 章 中 你 将 学 习 以 下 内 容 : 
“做 入 式 应 用 

“ 供 入 式 系统 中 的 微 控 制 器 
“ 处 理 1/O 设 备 限制 问题 

“ 使 用 C 语 言 控制 Mo 设备 
“片上 系统 设计 


计算 机 系统 被 用 在 了 各 种 应 用 中 ， 因 此 它们 可 表现 出 不 同 的 结构 、 不 同 的 规模 和 不 同 的 性 
能 。 对 于 任何 一 个 给 定 的 应 用 必须 考虑 的 重要 因素 包括 性 能 、 可 靠 性 和 成 本 。 任 何 一 个 可 以 处 
理 大 量 图 形 信息 ， 包 括 图 片 图 像 和 动画 的 计算 机 ， 都 必须 拥有 良好 的 实时 性 。 对 于 个 人 计算 机 
和 工作 站 来 讲 ， 重 要 的 是 在 满足 市 场 价格 要 求 的 情况 下 达到 最 好 的 性 能 。 特 别 高 的 性 能 必定 意 
味 着 价格 昂贵 ， 这 种 机 器 对 那些 要 求 在 给 定 的 时 间 里 要 完成 大 量 计算 的 问题 是 需要 的 。 计 算 性 
要 求 高 的 应 用 例子 有 : 复杂 系统 的 仿真 、 在 一 个 印刷 电路 板 上 确定 一 个 好 的 布线 方案 以 及 许多 
的 计算 机 辅助 设计 (CAD) 任务 。 这 类 应 用 在 个 人 计算 机 上 运行 可 能 要 花费 许多 小 时 才能 完成 。 
通常 需要 将 它们 放 在 一 个 计算 服务 器 上 运行 ， 相 对 高 价格 的 服务 器 可 以 实现 非常 高 的 性 能 。 第 8 
章 中 的 许多 内 容 涉及 到 建立 高 性 能 计算 机 的 问题 。 

在 许多 应 用 中 不 需要 高 性 能 的 处 理 器 。 目 前 微 处 理 器 控制 广泛 地 应 用 在 照相 机 、 移 动 电话 、 
可 视 电 话 、 销 售 终端 、 厨 房 器 具 、 汽 车 和 许多 玩具 中 。 在 这 些 应 用 中 高 性 能 不 是 主要 的 问题 ， 
低 费 用 和 高 可 靠 性 是 主要 的 需求 ， 小 型 化 和 低 功 耗 通常 是 最 重要 的 问题 。 所 有 这 些 应 用 可 以 用 
一 个 芯片 去 完成 ， 在 这 个 芯片 中 不 仅 包含 处 理 器 而 且 还 包含 一 些 输入 /输出 接口 、 计 时 器 电路 并 
共有 一 些 其 他 的 设计 特性 。 这 些 设 计 特 性 是 指使 用 少量 的 芯片 就 能 容易 地 完成 一 个 完整 的 计算 
机 控制 系统 。 这 些 包含 MO 接口 和 一 些 存储 器 的 微 处 理 器 芯片 通常 称 为 微 控 制 器 。 用 于 对 特定 目 
标 进行 计算 机 控制 而 不 是 用 于 通用 计算 的 实际 系统 ， 称 为 岩 入 式 系统 。 这 种 系统 是 本 章 讨论 的 
主题 。 


9.1 柑 入 式 系统 的 实例 


在 本 节 中 我 们 给 出 三 个 圣 入 式 系统 的 实例 ， 说 明 在 一 个 典型 的 戏 入 式 应 用 中 所 需要 的 处 理 
过 程 和 控制 功能 。 
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9.1.1 微波 炉 


许多 家 用 电器 使 用 计算 机 控制 去 管理 它们 的 操作 ， 上 典型 的 例子 就 是 微波 炉 。 这 种 用 具 基 于 
一 个 磁 控 管 发 生 器 产生 的 微波 去 加 热 在 一 个 封闭 空间 中 的 食物 。 当 微波 炉 开 启 时 ， 磁 控 管 产生 
最 大 的 功率 输出 ， 使 用 依据 受 控 的 时 间 间 隔 打 开 或 关闭 磁 控 管 的 方式 达到 降低 功率 的 目的 。 这 
样 ， 用 控制 功率 和 总 加 热 时 间 的 方法 ， 可 以 实现 京 调 操作 中 各 种 用 户 的 选择 。 

微波 炉 的 具体 规格 说 明 可 能 包括 以 下 的 京 调 操 作 : 

* 手动 选择 功率 级 别 和 京 调 时 间 。 

. FERRE RAP RIK. 

“ 在 用 户 指明 了 食物 类 型 〈 例 如: 肉 、 蔬 菜 或 爆 米 花 ) 以 及 食物 的 重量 时 自动 选择 。 一 个 合 

适 的 功率 和 时 间 随 后 由 控制 器 计算 出 来 。 

“根据 指定 食物 重量 的 自动 解冻 。 

炉 中 包含 一 个 显示 输出 ， 它 可 以 显示 : 

* 每 日 时 钟 定时 。 

* 总 饪 过 程 中 时 钟 定 时 器 递减 。 

* 给 用 户 的 提示 信息 。 

以 妖 鸣 声 形式 发 出 的 声音 报警 信号 ， 用 于 表示 京 饪 操作 结束 。 还 需要 提供 一 个 排 风 扁 和 一 
个 炉 灯 信和 号。 最 后 ， 如 果 炉 子 的 门 被 打开 ， 门 镇 必须 关闭 磁 挖 管 。 所 有 这 些 功 能 可 以 用 微 处 理 
器 控制 。 

与 用 户 有 关 的 输入 /输出 功能 必须 包括 : 

“输入 键 ， 它 包括 0 到 9 的 数字 键 以 及 Reset ( 重 置 )、Start (开启 )、Stop (暂停 )、Power 

Level (功率 级 别 )、Auto Defrost (自动 解冻 )、Auto Cooking (自动 烹饪 )、Clock Set (时 

钟 设置 ) 及 Fan Control (风扇 控制 ) 这 样 的 功能 键 。 为 了 减少 键 的 总 数量 ， 有 些 键 可 能 有 

多 重 功能 。 例 如 ， 按 下 Fan Control 键 一 段 时 间 可 以 用 来 选择 风扇 的 速度 。 

"液晶 显示 器 形式 的 显示 输出 (类似 于 七 段 显 示 ， 在 A.9 节 中 讨论 )。 

“一 个 小 型 扬声器 用 来 产生 蜂 鸣 声 。 

用 于 微波 炉 的 微 控制 器 可 以 用 一 个 小 型 的 微 处 理 器 -一 -基本 计算 机 单元 去 实现 。 因 为 这 里 
的 计算 任务 非常 简单 ， 仅 包括 维护 每 天 的 时 钟 时 间 、 确 定 在 各 种 训 饪 操作 中 所 需 的 动作 、 产 生 
打开 或 关闭 磁 控 管 和 电 风 扇 这 类 设备 的 控制 信号 以 及 生成 显示 信息 。 因 此 可 以 使 用 相对 简单 的 
处 理 器 去 执行 这 些 任 务 。 实 现 所 需 动 作 的 程序 非常 小 ， 它 们 必须 存储 在 一 个 不 易 委 失 的 只 读 存 
储 器 中 ， 这 样 当 关 闭 电源 时 才 不 会 丢失 。 还 需要 有 一 个 小 型 的 RAM 用 于 在 运算 过 程 中 执行 和 保 
存 用 户 的 输入 数据 。 最 重要 的 需求 是 要 具备 大 量 的 IO 能 力 使 其 能 够 与 所 有 的 输入 键 、 显 示 器 和 
输出 控制 信号 进行 交互 。 

从 设计 者 的 角度 来 看 ， 寻 找 一 种 经 济 的 解决 方案 去 实现 所 需要 的 控制 是 很 重要 的 。 并 行 1O 
端口 提供 了 一 套 与 外 部 输入 和 输出 信号 进行 交互 的 便利 方法 。 图 9-1 给 出 了 微波 炉 的 一 种 可 能 组 
成 结构 。 它 的 关键 之 处 在 于 使 用 的 硬件 总 量 非 常 小 ， 一 个 简单 的 处 理 器 带 有 一 些 够 用 的 ROM 和 
RAM 部 件 ， 以 及 简单 的 用 于 连接 该 系统 其 他 部 分 的 输入 输出 接口 。 在 单个 的 VLSI 芯片 中 实现 这 
些 电路 中 的 大 部 分 功能 是 可 行 的 。 
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图 9-1 一 个 微波 炉 的 框图 





9.1.2 数码 照相 机 


数码 照相 机 给 出 了 一 个 在 小 型 封装 设备 中 成 熟 的 伐 和 人 式 系统 的 优秀 范例 。 图 9-2 列 出 了 数码 
照相 机 中 的 主要 部 分 。 

传统 照相 机 使 用 胶片 去 捕获 图 像 。 在 数码 照相 机 中 ， 用 一 个 光 传 感 器 阵列 去 捕获 图 形 。 这 
些 传感器 是 基于 发 光 二 极 管 构造 的 ， 这 些 二 极 管 可 以 将 光 转 换 成 电荷 。 光 的 强度 决定 着 产生 电 
荷 总 量 的 大 小 。 有 两 种 不 同类 型 的 传感器 用 在 商业 产品 中 。 一 种 类 型 是 著名 的 电荷 硬 合 器 件 
(CCD )。 它 是 最 早 被 用 于 数字 照相 机 中 的 传 感 设备 ， 并 且 它 已 经 改进 成 可 提供 高 质量 图 像 的 设 
备 。 最 近 基 于 CMOS 技 术 的 传感器 已 经 开发 出 来 ， 它 们 的 价格 较 低 ， 但 是 不 能 像 CCD 那 样 提供 
高 质量 的 图 像 。 

每 个 传感器 产生 一 个 对 应 于 一 个 像素 的 电荷 ， 它 是 图 片 图 像 中 的 一 个 点 。 像 案 的 数量 决定 
着 可 以 记录 和 显示 的 图 片 的 质量 。 电 荷 是 一 个 模拟 量 ， 它 被 数 模 (AD) 转换 电路 转换 成 数字 表 
示 方式 。A/D 转 换 可 以 产生 一 个 图 像 的 数字 表示 形式 ， 其 中 每 个 像素 的 颜色 和 色彩 饱和 度 使 用 一 
个 多 位 的 数 表示 。 图 像 的 这 种 数字 形式 就 可 以 使 用 标准 的 计算 机 电路 进行 操作 了 。 

关键 的 功能 部 件 是 系统 控制 器 。 这 个 功能 块 包 含 着 处 理 器 、 存 储 器 (RAM 及 EEPROM 两 种 ) 
以 及 需要 与 系统 其 他 部 分 连接 的 接口 电路 。 处 理 器 控制 着 照相 机 的 操作 ， 它 处 理 原始 图 像 数据 ， 
即 从 A/D 电 路 中 接收 数据 生成 适合 于 计算 机 、 打 印 机 和 显示 设备 表示 的 标准 格式 。 主 要 使 用 的 格 
RA: TIFF 用 于 无 压缩 的 图 像 ，JPEG 用 于 压缩 的 图 像 。 

处 理 过 的 图 像 被 存储 在 一 个 大 型 图 像 存储 设备 中 ， 在 5.3.5 节 中 描述 的 内 存 卡 (Flash memory 
cards) 就 是 一 种 用 于 图 像 存储 的 流行 设备 。 其 他 的 选择 还 有 软盘 和 小 型 硬盘 设备 。 
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计算 机 接口 


连 到 PC 的 电缆 
图 9-2 一 个 简化 的 数码 照相 机 框图 


获取 并 处 理 过 的 图 像 可 以 显示 在 液晶 显示 器 的 屏幕 上 ， 该 屏幕 是 嵌 入 在 照相 机 中 的 。 这 里 
允许 用 户 决 定 哪个 图 像 值得 保存 ， 可 以 获取 并 保存 的 图 像 的 数量 与 图 像 存储 器 的 大 小 有 关 ， 同 
时 也 依赖 于 图 像 质量 的 选择 ， 即 每 个 图 像 中 像素 的 个 数 。 

标准 接口 提供 将 图 像 传递 到 计算 机 或 打印 机 中 的 简单 机 制 。 这 些 接口 可 能 是 一 个 简单 的 串 
行 或 并 行 接口 ， 或 是 一 个 针对 标准 总 线 〈 例 如 PCI 或 USB ) 的 连接 器 。 如 果 使 用 了 闪存 卡 ， 图 像 
也 可 以 使 用 物理 传递 卡 进行 传递 。 

系统 控制 器 还 生成 控制 运动 (用 于 对 目标 的 聚焦 ) 和 办 光 部 件 操作 所 需要 的 信号 。 有 一 些 
输入 信息 是 由 于 用 户 对 开关 的 操作 而 形成 的 。 

数码 照相 机 中 所 需要 的 处 理 器 比 以 前 描述 的 微波 炉 应 用 中 的 处 理 器 要 强大 许多 ， 该 处 理 器 
必须 执行 相当 复杂 的 信号 处 理 功能 。 而 且 ， 重 要 的 是 该 处 理 器 不 能 消耗 太 多 的 能 量 ， 因 为 照相 
机 是 一 种 用 电池 做 电源 的 设备 。 通 常 处 理 器 消耗 的 电能 比照 相机 中 显示 器 和 办 光 灯 所 消耗 的 电 
能 要 少 。 


913 家 用 遥测 技术 


计算 机 在 家 庭 中 的 应 用 正在 快速 增长 ， 它 们 被 当成 通用 的 计算 设备 ， 也 被 用 在 大 量 的 嵌入 
式 应 用 中 。 在 9.1.1 节 中 我 们 考虑 了 微波 炉 的 例子 ， 在 其 他 的 设备 中 还 可 以 找到 类 似 的 例子 ， 像 
洗衣 机 、 干 燥 机 、 洗 碗 机 、 炊 具 、 火 炉 以 及 空调 。 另 一 个 值得 关注 的 例子 是 可 视 电 话 ， 电 话 中 
的 这 种 修 入 式 处 理 器 使 得 电话 可 以 具有 多 种 有 用 的 特征 。 除 了 标准 的 电话 特征 外 ， 微 处 理 器 控 
制 的 电话 可 以 提供 对 家 庭 中 其 他 设备 的 远程 访问 功能 ， 它 也 可 以 被 当 作 计 算 机 设备 的 通信 设备 





来 使 用 。 

使 用 这 种 电话 的 人 可 以 远程 执行 以 下 的 功能 : 

“ 与 一 个 计算 机 控制 的 家 庭 安全 系统 通信 。 

* 对 火炉 或 空调 保持 的 温度 进行 调整 ， 设 定 一 个 合适 的 温度 。 

“ 对 提前 已 放 入 微波 炉 中 的 食品 设 定 启动 时 间 、 误 调 时 间 及 加 热 温度 。 

* 读 电 、 气 和 水 表 ， 取 代 过 去 服务 公司 派 遗 雇员 到 家 中 去 读 这 些 表 的 过 程 。 

如 果 涉 及 的 设备 是 由 微 处 理 器 控制 的 ， 那 么 所 有 这 些 功能 都 很 容易 实现 。 因 为 只 需要 在 设 [sie] 
备 中 的 微 处 理 器 与 电话 中 的 微 处 理 器 之 间 提 供 一 条 连接 即 可 。 这 些 连接 可 以 用 不 同 的 方式 实现 。 
最 简单 的 方式 是 使 用 按 位 串 行 通信 , 如 果 控 制 器 芯片 中 包含 有 UART 接 口 , 这 种 通信 很 容易 完成 ， 
这 种 类 型 的 通信 接口 在 4.6.2 节 中 讨论 过 。 用 远 距 离 的 信号 去 观察 并 控制 设备 状态 通常 称 为 这 测 
92 锯 入 式 应 用 中 的 处 理 器 芯片 


包含 有 一 个 处 理 器 、 一 些 存储 器 和 在 侍 入 式 应 用 中 用 到 的 MO 接口 电路 的 芯片 ， 通 常 称 作为 
谍 入 式 处 理 器 。 由 于 这 样 的 芯片 在 应 用 中 要 执行 重要 的 控制 功能 ， 并 且 它 是 基于 微 处 理 器 实现 
的 ， 因 此 它们 也 被 称 为 微 控制 器 芯片 。 

一 个 修 入 式 处 理 器 芯片 应 该 能 够 满足 为 各 种 各 样 的 应 用 提供 服务 的 要 求 。 图 9-3 给 出 了 一 个 
芯片 的 典型 模块 图 。 其 中 主要 的 部 分 是 处 理 器 核 ， 它 是 商用 微 处 理 器 的 一 个 基础 。 选 择 在 实际 
中 已 经 证 明 被 大 众 喜 爱 的 微 处 理 器 体系 结构 是 较 稳妥 的 ， 因 为 对 这 样 的 处 理 器 已 经 有 许多 CAD 
工具 、 优 秀 的 书籍 以 及 大 量 有 助 于 新 产品 设计 的 经 验 和 知识 。 


连接 处 部 并 行 VO 端 日 < — 


存储 器 < 处 理 器 核 
有 
内 部 存储 器 
f 计数 器 /定时 器 KK 一 一 > 517 


图 9-3 嵌 人 式 处 理 器 框图 


在 艺 片 中 包含 一 些 存储 器 是 非常 有 用 的 ， 你 可 能 会 发 现在 小 型 应 用 中 这 些 存储 器 可 能 完全 
能 够 满足 应 用 需求 中 的 存储 要 求 。 这 些 存 储 器 中 有 些 必须 是 RAM 类 型 的 ， 用 于 存储 那些 在 计算 
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中 发 生变 化 的 数据 ;有些 应 该 是 &OM 类 型 的 ， 用 来 存储 软件 ， 因 为 嵌入 式 系统 中 通常 不 包括 磁 
盘 驱 动 器 。 为 了 满足 低 容量 应 用 中 的 成 本 效益 ， 需 要 有 一 种 可 现场 编程 的 ROM 类 型 ， 而 实现 这 
种 存储 的 流行 选择 是 EEPROM 和 内 存 。 

有 几 种 IO 端口 可 以 提供 并 行 和 串 行 的 接口 。 这 些 接口 可 以 容易 地 实现 标准 的 MO 连接 。 在 许 
多 的 应 用 中 ， 需 要 以 可 编程 时 间 间 隔 生 成 控制 信和 号。 如 果 嵌 入 式 处 理 器 芯片 中 包含 一 个 定时 器 
电路 ， 这 类 任务 就 很 容易 完成 。 因 为 定时 器 是 一 个 时 钟 脉冲 计数 电路 ， 所 以 它 也 可 以 用 作 计 数 ， 
比如 对 一 个 给 定 的 输入 线 的 脉冲 个 数 进行 计数 。 

在 一 个 嵌 和 人 式 系统 中 可 能 包含 一 些 模拟 设备 ， 为 了 能 与 这 样 的 设备 进行 交互 ， 就 需要 能 够 
将 模拟 信和 号 转换 成 数字 表示 形式 ， 并 且 反 之 亦 然 。 如 果 嵌 人 式 控 制 器 中 包含 有 A/D 和 D/A 转 换 电 
路 ， 这 些 也 是 很 容易 做 到 的 。 

许多 财 和 人 式 处 理 器 芯片 在 市 面 上 可 以 得 到 ， 一 些 比较 好 的 芯片 是 : Motorola 的 68HC11、 
683xx 及 MCF5xxx 系 列 ，Intel 的 8051 和 MCS-96 系列 ， 它 们 使 用 CISC 型 处 理 器 核 ， 和 而 ARM 微 控 
制 器 具有 RISC 型 的 处 理 器 。 处 理 器 核 的 特性 在 本 章 不 是 重要 的 内 容 ， 我 们 强调 的 是 伐 入 式 应 用 
系统 方面 的 内 容 ， 并 说 明 如 何 将 前 几 章 的 概念 结合 起 来 用 到 一 个 完整 的 嵌入 式 计算 机 系统 的 设 
计 中 去 。 


93 一 个 简单 的 微 控 制 器 


在 这 一 节 中 我 们 讨论 一 个 简单 微 控制 器 的 基本 构成 ， 说 明 在 实际 中 有 哪些 典型 特征 会 被 用 
到 。 图 9-4 给 出 了 它 的 框图 ， 其 中 包含 一 个 处 理 器 核 和 一 些 片上 存储 器 。 因 为 片上 存储 器 可 能 满 
是 不 了 所 有 潜在 的 应 用 ， 因 此 在 该 芯片 的 管 丢 上 提供 了 处 理 器 的 总 线 连接 ， 以 便 可 以 添加 外 部 
存储 器 。 

它 有 两 个 8 位 并 行 接口 A 和 B 和 一 个 串 行 接口 。 该 微 控 制 器 还 包含 一 个 32 位 的 计数 器 /定时 器 
电路 ， 该 电路 可 以 用 于 以 编程 时 间 间 隔 产生 内 部 中 断 、 作 为 系统 的 时 钟 、 对 输入 线 上 的 脉冲 个 
数 计 数 、 生 成 各 种 循环 的 方 波 输出 信号 等 。 


9.3.1 并 行 VO 端 口 


并 行 接口 提供 的 MO 能 力 类 似 于 在 图 4-34 中 描述 的 方案 。 在 A 和 B 端 口上 每 个 独立 的 端口 连 线 
都 可 以 被 用 作 输 入 或 是 输出 ， 输 入 /输出 的 方向 是 由 存储 在 数据 定向 寄存 器 中 的 位 模式 决定 的 。 
图 9-5 说 明了 对 端口 A 上 的 某 一 位 的 双向 控制 。 如 果 数 据 定向 触发 器 的 值 为 O 时 ， 端 日 引 脚 P4; 就 
被 当 作 一 个 输入 。 在 这 种 情况 下 ， 一 个 激活 的 控制 信号 Read_Port 的 逻辑 值 被 放 在 处 理 器 总 线 的 
数据 线 D; 端口 上。 在 这 个 输入 线路 中 不 包含 存储 单元 (相当 于 图 4-34 中 的 DATAIN)， 因 此 处 理 
器 从 端口 管 脚 上 直接 读 该 数据 。 如 果 数 据 定向 触发 器 中 设置 的 值 为 1， 端 口 管 脚 作为 输出 使 用 。 
这 种 情况 下 ， 在 控制 信号 Write_Port 的 控制 下 ， 加 载 到 数据 输出 触发 器 上 的 逻辑 值 被 放置 在 引 肢 
处 。 由 于 数据 的 方向 位 是 按 每 一 个 引 脚 提供 的 ， 因 此 一 些 引 脚 可 以 被 编程 为 输入 ， 而 另 一 些 可 
以 作为 输出 。 

端口 A 和 B 之 问 的 数据 传递 操作 涉及 到 的 八 个 8 位 寄存 器 ， 在 图 9-6 中 给 予 了 描述 。 图 中 还 给 
出 了 这 些 寄 存 器 的 存储 器 映射 地 址 。 这 里 我 们 任意 选择 了 32 位 地 址 范围 中 的 高 端 地 址 。 

状态 寄存 器 PSTAT 包 含 着 状态 标志 。 当 端口 A 的 管 脚 上 有 一 个 新 到 的 数据 时 ，PASIN 标 志 被 
置 成 1。 当 处 理 器 用 读 PAIN 寄 存 器 的 操作 接收 了 该 数据 后 ， 它 又 被 清 成 0。 当 寄存 器 PASOUT 中 





KARÉ 


365 


的 数据 被 传递 到 连接 设备 时 ，PASOUT 标 志 置 成 1， 表 示 处 理 器 现在 可 以 向 PAOUT 中 装 入 新 数据 


了 【控制 线 上 标志 传递 到 设备 的 信号 在 下 文中 描述 )。 


当 处 理 器 将 数据 写 人 PAOUT 时 ，PASOUT 


标志 被 清 成 0。PBSIN 和 PBSOUT 标 志 对 端口 B 执 行 同样 的 功能 。 








Counter_in 


Timer_out 


图 9-4 一 个 微 控 制 器 的 例子 


状态 寄存 器 还 包含 了 四 个 中 断 标志 。 当 某 个 中 
断 被 允许 并 且 相 应 的 IO 动作 发 生 时 ， 就 有 一 个 中 断 
标志 (比如 IAIN) 被 设置 成 1。 中 断 人 允许 位 保存 在 控 
制 寄 存 器 的 PCONT 中 。PCONT 中 的 某 个 允许 位 设置 
成 1 就 可 以 允许 相应 的 中 断 发 生 。 例 如 ， 如 果 
ENAIN=1 并 且 PASIN=1， 则 中 断 标 志 IAIN 被 置 成 1 并 
且 产 生 一 个 中 断 请 求 。 因 此 ， 

IAIN =ENAIN . PASIN 

就 有 一 个 单独 的 中 断 请 求 信 号 被 使 用 。 作 为 对 某 个 
中 断 请 求 的 响应 ， 处 理 器 必须 检查 该 中 断 标志 以 确 
定 该 中 断 请 求 的 实际 来 源 。 

状态 和 控制 寄存 器 中 的 信息 用 于 控制 传递 到 或 
来 自 于 连接 到 端口 A 和 端口 B 上 设备 中 的 数据 。 端 口 
A 有 了 两 条 控制 线 CAIN 和 CAOUT， 它 们 可 以 用 于 为 接 


Read_Port 


Write_Port 


Write_DIR 





数据 定向 
图 9-5 访问 图 9-4 端 日 A 中 的 一 位 


口 和 连接 设备 间 提 供 以 下 的 信号 机 制 : 当 设备 将 一 个 新 数据 放置 在 端口 引 脚 时 ， 它 表示 在 一 个 
时 钟 周期 中 该 动作 被 一 个 CAIN 连 线 激活 。 当 接口 电路 观测 到 CAIN=1 时 ， 它 将 状态 位 PASIN 署 成 
1。 稍 后 ， 当 处 理 器 读 出 了 这 个 输入 数据 时 该 位 被 清 成 90。 这 个 动作 还 引发 该 接口 向 CAOUT 连 线 
发 送 一 个 脉冲 ， 通 知 该 设备 可 以 向 接口 发 送 新 的 数据 了 。 对 于 输出 传递 ， 处 理 器 将 数据 写 入 
PAOUT 寄 存 器 中 ， 这 个 动作 也 将 PASOUT 位 清 成 0 并 向 CAOUT 连 线 发 送 一 个 脉冲 ， 通知 设备 可 
以 得 到 一 个 新 数据 了 。 当 设备 拿 到 该 数据 时 ， 它 再 向 CAIN 连 线 发 送 一 个 脉冲 指明 这 个 动作 ， 它 
又 将 PASOUT 变 换 成 1。 当 一 个 端口 上 的 所 有 数据 引 叶 有 着 同样 的 方向 时 ， 也 就 是 当 端口 都 作为 
输入 或 输出 时 ， 这 种 信号 机 制 是 可 使 用 的 。 如 果 有 些 引 脚 选择 的 是 输入 而 有 些 选择 的 是 输出 ， 
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此 时 控制 线 以 及 状态 和 控制 寄存 器 中 均 不 包含 有 用 的 信息 。 











地 址 re too A se AAR Fmt E A 
FFFFFFFO | PAIN | 端口 A 输 入 
RR 
—O WI 
FFFFFEF1 PAOUT i 端口 A 输出 
端口 A 方向 
端口 B 输 入 
端口 B 输 出 
端口 A 方 向 


状态 寄存 器 (PSTAT) 


PASIN 
PASOUT 
PBSIN 
PBSOUT 





控制 寄存 器 (PCONT ) 





ENAIN 
ENAOUT 






图 9-6 并 行 接口 寄存 器 
9.3.2 品行 /O 接 口 


串 行 接口 基于 在 图 4-37 中 说 明 的 原理 提供 UART (Universal Asynchronous Receiver 
Transmitter ， 通 用 异步 收发 器 ) 功能 的 数据 传递 。 在 发 送 与 接收 路 径 中 使 用 了 双 缓 冲 ， 如 图 9-7 
所 示 。 这 种 缓冲 是 为 了 解决 JO 传 递 中 的 瞬间 冲突 。 

图 9-8 给 出 串 行 接口 的 可 编 址 地 址 寄存 器 ， 输 入 数据 是 从 8 位 接收 缓冲 区 中 读 出 的 ， 输 出 数 
据 是 送 入 到 8 位 传送 缓冲 区 中 去 的 。 状 态 寄存 器 SSTAT 提 供 有 关 接 收 和 传送 单元 的 当前 状态 信息 。 
当 在 接收 缓冲 区 中 存在 有 效 的 数据 时 ，SSTAT。 位 被 署 成 1。 当 传送 缓冲 区 为 空 并 可 以 装 入 新 数据 


”时 ，SSTAT, 被 置 成 1。 这 些 位 与 在 4.1 节 中 描述 的 状态 特征 位 SIN 和 SOUT 起 着 相同 的 作用 。 如 果 


在 接收 过 程 中 产生 了 一 个 错误 ，SSTAT; 就 被 置 成 1。 例 如 ， 如 果 接 收 缓冲 区 中 的 数据 在 还 未 被 处 
理 器 读 出 之 前 被 后 面 接 收 的 字符 禾 盖 ， 就 产生 一 个 错误 。 状 态 寄存 器 中 还 包含 有 中 断 标志 ， 当 
接收 缓冲 区 已 满 并 且 接收 中 断 是 允许 的 ，SSTAT, 位 被 置 成 1。 类 似 地 ， 当 传送 缓冲 区 为 空 并 且 
传送 中 断 是 允许 的 ，SSTAT; 位 被 置 成 1。 如 果 SSTAT 或 是 SSTAT; 等 于 1 时 ， 捉 行 接口 就 引发 一 个 
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中 断 。 如 果 SSTATs =1 或 者 SSTAT2 =1， 并 且 错 误 条 件 中 断 是 允许 的 ， 它 也 引发 一 个 中 断 。 
控制 寄存 器 SCONT 用 来 保存 中 断 允 许 位 。 



















设 定 SCONT。4 位 为 1 或 0， 分别 表 示人 允许 或 禁 
止 相应 的 中 断 发 生 。 读 寄存 器 中 还 说 明 如 何 生 
成 传送 时 钟 ， 如 果 SCONT, = 0， 则 传送 的 时 钟 
与 系统 (处 理 器 ) 时 钟 相同 ; 如 果 SCONT =1, 
则 用 时 钟 除法 电路 获得 传送 时 钟 。 
串 行 接口 中 的 最 后 一 个 寄存 器 是 时 钟 除 
数 寄存 器 DIV。 这 个 32 位 的 寄存 器 与 计数 器 2 
电路 相关 联 ， 用 它 除 以 系统 时 钟 信号 可 以 生 
成 品行 传送 时 钟 。 计数 器 生成 一 个 时 钟 信 号 ， PO 
它 的 频率 等 于 系统 时 钟 被 该 寄存 器 中 的 内 容 
除 所 得 到 的 频率 。 存 入 该 寄存 器 的 这 个 值 被 
传递 到 计数 器 中 ， 然 后 系统 时 钟 进行 递减 计 | 
数 。 当 计数 减 为 零 时 ， 该 计数 器 用 DIV 寄 存 中行 输出 
器 中 的 值 重新 装 入 。 图 9-7 串 行 接口 中 的 接收 和 传送 结构 
地 址 
FFFFFFE0 RBUF | 接收 缓冲 区 
FFFFFFE1 | TBUF l | RAE 
7 6 5 4 3 2 1 0 
FFFFFFE2 | 次 态 寄存 器 (SSTAT) 
1 :错误 中 断 1 : 接收 区 清 
1 :传送 区 中 断 1: 传送 区 空 
1 :接收 区 中 断 1: 发 现 错误 
FFFFFFE3 控制 寄存 器 (SCONT) 
1: 允许 错误 中 断 0: 系统 时 钟 
1: 允许 传送 区 中 断 1 : 分 频 时 钟 
1: 允许 接收 区 中 断 





31 0 


FFFFFFE4 DIV (除数 寄存 器 ) 


图 9-8 串 行 接口 寄存 器 


9.3.3 计数 器 /定时 器 


32 位 的 递减 计数 器 电路 可 以 作为 计数 器 或 定时 器 使 用 。 该 电路 的 基本 操作 包括 将 一 个 初始 
值 加 载 到 计数 器 中 ， 然 后 使 用 内 部 系统 时 钟 或 是 外 部 时 钟 信号 递减 计数 器 中 的 内 容 。 这 个 电路 
可 用 编程 实现 ， 当 计数 器 中 的 内 容 达 到 0 时 引发 一 个 中 断 。 图 9-9 给 出 了 与 计数 器 /定时 器 电路 相 
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连 的 寄存 器 。 计 数 器 /定时 器 的 寄存 器 CNTM 可 以 被 装 入 一 个 初 值 ， 然 后 将 它 传递 到 计数 器 电路 
中 。 计 数 器 中 的 当前 内 容 可 以 用 访问 内 存 地 址 EFFFFFD4 的 方式 读 出 。 控 制 寄存 器 CTICON 是 用 
于 指明 计数 器 /定时 器 电路 的 操作 方式 的 。 它 提供 了 一 种 用 于 开始 和 停止 计数 处 理 以 及 当 计数 器 
内 容 递 减 为 0 时 人 允许 中 断 的 机 制 。 状 态 寄 存 器 CTSTAT 反 映 该 电路 的 状态 。 





地 址 31 0 
FFFFFFDO | CNTM (初始 值 ) | 
FEFFEFD4 COUNT (计数 器 内 容 ) 





控制 寄存 器 (CTCON) 





1: 开始 
l: 停止 








i . i 状态 寄存 器 (CTSTAT) 
1: 计数 器 达到 0 
图 9-9 计数 器 /定时 器 寄存 器 


计数 器 模式 

设 定 CTCON; 为 0， 可 选择 该 电路 为 计数 器 模式 ， 初 始 值 用 写 人 寄存 器 CNTM 的 方式 写 人 计 
数 器 中 。 当 CTCON。 位 被 程序 指令 设置 成 1 时 计数 过 程 开始 。 一 旦 计数 器 开始 计数 ，CTCONo 位 
自动 清 为 0。 计 数 器 被 计数 器 输入 (Counter_in ) 线 上 的 脉冲 递减 。 当 达到 0 时 ， 计 数 器 电路 将 状 
态 标 志 CTSTAT。o 被 置 成 1， 并 且 如 果 相 应 的 中 断 允 许 位 已 经 被 置 成 1， 将 引发 一 个 中 断 。 在 下 一 
个 时 钟 脉冲 到 来 时 计数 器 重新 装 入 一 个 初 值 ， 这 个 初始 值 是 被 保存 在 寄存 器 CNTM 中 的 ， 这 时 
计数 过 程 继续 。 当 CTCON 被 设置 为 1 时 计数 过 程 停止。 

定时 器 模式 

设 定 CTCON? 为 1 时 选择 该 电路 为 定时 器 模式 ， 这 种 模式 适 于 在 图 9-4 中 的 输出 线 Timer_out 上 
生成 一 个 方 波 信号 。 这 个 过 程 的 开始 如 同上 面 对 计 数 器 模式 的 解释 一 样 ， 当 计数 器 进行 递减 计 
数 时 ， 输 出 线 上 的 值 保持 着 一 个 常数 。 直 到 减 到 0 时 ， 计数器 自动 用 初始 值 进行 重新 加 载 ， 这 时 
连 线 上 的 输出 信号 反 向 。 因 此 ， 输 出 信号 的 周期 是 控制 时 钟 脉冲 起 始 计数 值 的 两 倍 。 在 定时 器 
模式 下 ， 计 数 器 用 系统 时 钟 作 递减 操作 。 


9.3.4 中 断 控 制 机 制 


微 控 制 器 有 两 个 中 断 请 求 线 IRQ 和 XRQ。IRQ 线 用 于 由 微 控制 器 内 部 WO 接口 引发 的 中 断 ; 
XRQ 线 用 于 由 外 部 设备 引发 的 中 断 。 当 处 理 器 发 现 IRQ 线 被 激活 时 ， 它 用 轮 询 方式 确定 该 中 断 
请 求 源 。 完 成 这 个 过 程 就 是 对 状态 寄存 器 的 标志 位 PSTAT、SSTAT 及 CTSTAT 进 行 轮 询 。XRQ 中 
断 的 优先 级 比 耻 Q 中 断 的 优先 级 高 。 

处 理 器 中 的 状态 寄存 器 PSR 有 两 个 允许 中 断 位 。 如 果 PSRe=1，IRQ 中 断 被 允许 ; 如 果 





PSR7 =1，XRQ 中 断 被 允许 。 当 处 理 器 接收 一 个 中 断 时 ， 它 将 在 中 断 服务 程序 执行 前 清除 相应 
的 PSR 位 ， 禁 止 同一 优先 级 上 的 其 他 中 断 产生 。 这 里 要 用 到 一 个 中 断 向 量 表 ， 其 中 对 应 王 IRQ 
和 XRQ 的 中 断 向 量 分 别 存储 在 单元 $24 和 $28 中 。 每 个 中 断 向 量 中 包含 着 相应 的 中 断 服务 程序 
的 第 一 条 指令 的 地 址 。 

在 处 理 器 中 有 一 个 链接 寄存 器 LR ， 它 如 同 在 2.9 节 中 讲述 的 那样 ， 被 用 做 子 程序 的 链接 。 当 
有 一 个 子 程序 调用 指令 对 程序 计数 器 PC 的 内 容 进行 更 新 时 ,PC 中 需要 返回 的 地 址 被 保存 在 LR 中 ， 
然后 用 预定 好 的 转移 子 程序 的 第 一 条 指令 更 新 。 当 接收 一 个 中 断 请 求 时 ， 将 发 生 同 样 的 动作 。 
但 这 时 ,除了 将 返回 地 址 保存 在 LR 中 以 外 ， 处 理 器 状态 寄存 器 PSR 中 的 内 容 还 应 保存 在 处 理 器 
的 寄存 器 IPSR 中 。 

从 子 程序 返回 是 执行 一 个 ReturnS 指 令 完 成 的 ， 该 指令 将 LR 中 的 内 容 传递 到 PC 中 。 从 中 断 
中 返回 是 执行 ReturnI 指 令 完 成 的 ， 该 指令 分 别 将 LR 和 IPSR 中 的 内 容 传递 到 PC 和 PSR 中 。 因 为 只 
有 一 个 LR 和 IPSR 寄 存 器 ， 媒 套 式 中 断 可 以 用 在 中 断 服 务 程序 中 使 用 一 条 指令 ， 将 这 些 寄存 器 中 
的 内 容 存 储 在 堆栈 中 的 方法 来 实现 。 这 种 策略 类 似 于 4.3.1 节 中 讨论 的 ARM 解 决 方案 。 


9.4 程序 设计 问题 


前 面 已 经 介绍 了 微 控制 器 的 硬件 ， 现 在 我 们 来 考虑 一 些 软件 方面 的 问题 。 可 以 用 汇编 语言 
或 高 级 语言 来 编写 程序 。 后 一 种 选择 在 大 部 分 应 用 中 更 可 取 ， 因 为 这 样 所 需要 的 编码 容易 生成 
并 且 容 易 维护 ， 而 且 开 发 时 间 缩 短 。 我 们 将 用 两 种 语言 方式 给 出 一 些 实例 。 本 节 中 的 例子 是 一 
些 最 基本 的 应 用 ,我 们 的 主要 目的 是 为 了 说 明 实 现 方 法 的 可 能 性 。 在 9.5 节 中 ， 我 们 将 给 出 一 个 
完整 旦 比较 复杂 的 实例 ， 并 且 选 择 C 语 言 作为 高 级 编程 语言 。 

考虑 以 下 任务 ， 微 控制 器 要 从 一 个 串 行 位 的 数 源 处 将 8 位 字符 传递 到 并 行 位 。 数 源 连接 到 串 

行 接 日 上 ， 目 标 被 连接 到 并 行 端口 A 上 。 当 接收 缓冲 区 中 存 有 一 个 字符 时 ， 通 过 将 状态 寄存 器 的 
相应 位 置 成 1 来 表示 ， 也 就 是 SSTAT。 = 1。 并 行 端 已 经 被 设置 成 了 输出 方式 ， 这 是 通过 将 数据 定 
向 寄存 器 中 所 有 位 都 置 成 1 (PADIR, o= $FF) 完成 的 。 我 们 假定 输出 设备 通过 端口 A 接收 字符 
的 速度 比 通过 申 行 口 提 交 字 符 的 源 设备 要 快 ， 这 样 就 不 需要 去 轮 询 端 口 A， 看 它 是 否 准备 好 接收 
下 一 个 字符 了 。 首 先 我 们 用 轮 询 方式 说 明 如 何 完成 所 需要 的 传递 ， 然 后 再 用 中 断 方式 来 实现 同 
样 的 任务 。 


9.4.1 轮 询 方法 


如 同 在 2.7 节 中 描述 的 那样 ， 轮 询 方式 需要 反复 地 测试 状态 标志 ， 直 到 接收 到 一 个 字符 为 止 。 
在 我 们 的 例子 中 ， 需 要 轮 询 的 是 SSTAT。 位 。 

汇编 语言 程序 

图 9-10 说 明了 使 用 汇编 语言 如 何 实现 这 一 任务 。 我 们 用 在 第 2 章 中 使 用 过 的 一 般 格 式 ， 对 微 
控制 器 中 的 MO 寄存 器 使 用 符号 名 与 寄存 器 的 地 址 相 结合 的 方式 进行 说 明 。 程 序 不 断 地 循环 检查 
状态 位 SSTATo。 一 旦 SSTATo = 1， 接 收 缓冲 区 RBUF 中 的 字符 就 被 传递 到 了 端口 A 上 。 调 用 执行 
对 RBUEF 的 读 操 作 自 动 清除 SSTATo 位 。 如 果 PSTAT, = 1， 该 字符 被 写 到 PAOUT 寄 存 器 中 。 

图 9-10 中 的 程序 使 用 一 个 无 限 循环 的 方法 传递 一 个 连续 的 字符 流 。 在 实际 应 用 中 此 处 不 应 
该 使 用 无 限 循环 ， 因 为 如 果 这 样 其 他 的 任务 可 能 也 会 因此 变 得 复杂 起 来 。 我 们 此 处 使 用 无 限 特 
环 只 是 为 了 使 例子 简单 化 。 
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EQU 接收 缓冲 区 

EQU 用 于 串 行 接口 的 状态 寄存 器 
EQU 端口 A 的 输出 数据 

EQU 端口 A 的 定向 寄存 器 


ORIGIN $1000 
MoveByte #$FEPADIR 配置 端口 A 为 输出 端口 


* ' 传 送 字符 
LOOP Testbit #0,SSTAT 查看 是 否 有 准备 好 的 新 字符 
Branch=0 LOOP 


MoveByte RBUEPAOUT 传送 一 个 字符 到 端口 A 
Branch LOOP 





图 9-10 使 用 轮 询 方式 完成 字符 传送 的 一 个 通用 汇编 语言 程序 

C 程 序 

在 C 语 言 程 序 中， 存储 器 映射 的 VO 单元 可 以 使 用 指针 变量 来 表示 ，、 指 针 变量 中 的 值 是 这 个 
单元 的 地 址 。 如 果 这 个 位 置 的 内 容 被 当成 字符 看 待 ， 该 指针 应 该 说 明成 字符 类 型 。 这 样 定义 该 
内 容 的 长 度 为 一 个 字 节 ， 它 是 VO 寄存 器 的 大 小 。 寄 存 器 的 内 容 可 以 方便 地 转换 成 16 进 制 形式 。 

图 9-11 给 出 了 一 个 实现 上 述 任务 的 C 语 言 程序 。Define 语 句 用 来 将 需要 的 地 址 与 指针 的 符号 
名 关联 起 来 。 这 些 语句 与 图 9-10 中 的 EQU 语 句 的 作用 相同 。 它 们 有 助 于 C 编 译 器 的 预 处 理 程序 用 
实际 值 去 趟 换 程序 中 的 符号 名 。 编 译 后 的 代码 类 似 于 图 9-10 中 的 代码 。 

福 意 这 里 RBUF 和 SSTAT 指 针 被 声明 成 了 可 变 的 (volatile )。 这 样 做 是 因为 这 个 程序 只 能 读 
相应 地 址 中 的 内 容 ， 旗 不 能 向 这 些 地 址 写 任 何 数据 ， 也 不 能 将 这 些 地 址 与 特定 的 值 相关 联 。 优 
化 编译 程序 可 能 会 删除 那些 看 来 不 会 产生 影响 的 语句 ， 这 些 语句 中 包含 一 些 有 关 的 变量 ， 但 它 
们 的 值 从 未 被 改变 过 。 因 为 RBUF 和 SSTAT 寄 存 器 的 内 容 改 变 是 受 程 序 外 部 因素 影响 的 ， 所 以 非 
常 有 必要 将 这 个 事实 告诉 编译 程序 。 编 译 程序 不 能 删除 那些 包含 可 变 变量 的 语句 。 

图 9-12 举 例 说 明了 另 一 种 不 同 的 方法 。 我 们 不 将 图 9-11 中 指向 MO 寄存 器 的 指针 定义 成 常数 ， 
而 将 指针 声明 成 变量 ， 它 指向 保存 字符 类 型 数据 的 单元 。 这 样 ， 像 RBUF 和 PAOUT 这 样 的 符号 
就 代表 存放 着 MO 寄存 器 实际 地 址 的 内 存单 元 的 地 址 。 在 这 种 情况 下 ， 编 译 后 的 代码 就 可 能 表现 
为 如 图 9-13 中 所 示 的 内 容 。 当 要 访问 一 个 指定 的 MO 寄存 器 时 ， 它 的 地 址 被 送 入 处 理 器 的 一 个 寄 
存 器 中 ， 然 后 使 用 寄存 器 间接 寻 址 方式 去 访问 所 需 的 IO 寄存 器 。 注 意 ， 图 中 给 出 的 仅仅 是 编译 
后 代码 中 的 一 部 分 内 容 ， 编 译 程序 也 给 出 了 与 符号 RBUF、SSTAT、PAOUT 以 及 PADIR 相 关 的 内 
存 地 址 值 。 从 该 图 程序 中 产生 的 机 器 码 会 比 从 图 9-11 中 产生 的 机 器 码 多 。 在 以 后 的 例子 中 我 们 
将 使 用 图 9-11 中 使 用 的 方式 来 定义 指针 。 使 用 define 语 名 指定 IO 单元 的 地 址 所 强调 的 事实 是 ;这 
些 地 址 是 常数 ， 它 们 在 程序 执行 中 从 不 发 生变 化 。 

在 本 章 的 C 程 序 中 ， 可 以 包括 一 个 特定 的 值 ， 它 在 执行 给 定 动作 的 语句 时 被 直接 地 存 人 到 了 
寄存 器 中 。 例 如 ， 在 图 9-11 中 有 语句 : 

*PADIR = 0xFF 


该 语句 将 寄存 器 PADIR 的 8 位 都 置 成 了 1， 使 得 端口 A 成 为 一 个 输出 端 。 在 C 程 序 编 写 中 更 常用 
的 方法 是 为 这 样 的 常数 值 声 明 一 个 名 字 ， 然 后 在 以 后 的 程序 中 使 用 这 个 名 字 。 这 样 选择 的 目的 
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是 为 了 保证 数字 尽 可 能 地 小 ， 并 且 使 得 它 容易 与 1O 寄 存 器 的 具体 值 进行 比较 ， 如 图 9-6 到 图 9-9 


所 示 。 
/* 定义 寄存 器 地 址 */ 


#define RBUF (volatile char *) OxFFFFFFEO 
#define SSTAT (volatile char *) OxFFFFFFE2 
#define PAOUT (char *) OxFFFFFFFI 
#define PADIR (char *) OxFFFFFFF2 


void main() 


{ 
/* 初始 化 并 行 端口 */ 


*PADIR = OxFF; /* 将 端口 A 配 置 为 输出 端口 */ 


户 传送 字符 */ 
while (1) { A* 无 限 循 环 */ 
while ((*SSTAT & 0x1) == O); F 等 待 一 个 新 字符 */ 
) *PAOUT = *RBUF; M 将 字符 传输 到 端口 A_ */ 
} 


图 9-11 使 用 轮 询 方式 传送 字符 的 C 程 序 


f 定义 寄存 器 地 址 */ 

volatile char *RBUF = (char *) 0xFFFFFFE0; 
volatile char *SSTAT = (char *) 0xFFFFFFE2; 
char *PAOUT = (char *) OxFFFFFFF1; 

char *PADIR = (char *) OxFFFEFEF2; 


void main() 


六 初始 化 并 行 端口 */ 
*PADIR = 0xFF; /* 将 端口 A 配 置 为 输出 端 日 % 


/* 传送 字符 * 
while (1) ( f 无 限 循环 */ 
while ((*SSTAT & 0xl) = 0); /#* 等 待 一 个 新 字符 */ 
) *PAOUT = *RBUF; M 将 字符 传送 到 端口 A */ 
) 


图 9-12 另 一 种 使 用 轮 询 方式 传送 字符 的 C 程 序 


Move PADIR,RO 
MoveByte #$FE(RO) 
Move SSTAT,RO 

Testbit #0,(RO) 


Branch=0 LOOP 
Move RBUFRO 
Move PAOUTR1 
Move (RO) RI 
Branch LOOP 





图 9-13 图 9-12 中 的 程序 段 编译 后 可 能 生成 的 代码 








Un 
N 
~J 
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94.2 中 断 方法 
作为 替换 SSTAT。 位 循环 轮 询 来 检测 新 字符 的 方法 ， 我 们 可 以 将 IO 接口 配置 成 当 SSTAIo= 1 


时 引发 一 个 中 断 请 求 。 这 时 相应 的 SCONT 寄 存 器 中 的 中 断 允 许 位 SCONT 必须 被 置 成 1， 还 需要 “ 


在 处 理 器 中 将 PSRs 置 成 1 使 得 下 Q 中 断 被 允许 。 这 些 可 以 通过 将 $40 装 入 到 PSR 来 实现， 这 样 也 禁 
止 了 XRQ 中 断 。 中 断 服 务 程序 的 地 址 必须 存放 在 存储 单元 $24 中 。 

汇编 语言 程序 

图 9-14 给 出 了 一 个 汇编 程序 ， 它 以 中 断 方式 实现 字符 传送 的 例子 。 当 SSTATo= 1 时 ， 引 发 一 
个 中 断 请 求 。 在 中 断 应 答 中 ， 中 断 服务 程序 从 RBUF 中 将 一 个 字符 传递 到 PAOUT 中 。 在 读 接收 
缓冲 区 RBUF 内 容 的 同时 还 要 将 SSTATo 位 清 成 0。 注 意 ， 这 里 程序 中 没有 引用 SSTAT 状 态 寄 存 器 
中 的 内 容 ， 与 以 前 的 范例 一 样 此 处 再 次 采用 了 一 个 无 限 循环 语句 等 待 一 个 新 字符 的 产生 ， 这 样 
可 保持 例子 的 简单 化 。 

C 程 序 

使 用 中 断 方式 写 C 程 序 ， 我 们 需要 解决 两 个 问题 : 

* 如 何 访问 处 理 器 的 寄存 器 ? 

。 如 何 写 中 断 服务 程序 ? 
中 断 实现 方式 要 求 处 理 器 状态 寄存 器 中 的 中 断 控制 位 做 适当 的 设置 。 这 就 涉及 对 PSR 的 写 操作 。 
在 高 级 语言 (比如 C) 中 ， 变 量 在 编译 代码 中 用 存储 单元 来 表示 。 因 此 ， 存 储 器 映射 IO 寄存 器 
可 以 通过 直接 的 方式 进行 处 理 ， 就 像 我 们 在 图 9-11 和 图 9-12 中 做 的 那样 。 但 是 ， 处 理 器 寄存 器 
(比如 状态 寄存 器 PSR) 没有 相应 的 内 存 地 址 与 其 对 应 ， 这 些 寄存 器 在 C 程 序 中 可 以 用 直接 包含 
相应 的 汇编 语言 指令 的 方式 进行 访问 。 例 如 以 下 语句: 

__asm _( “Move #0x40,%PSR”) 
使 得 C 编 译 程序 将 以 下 汇编 指令 
Move #$40, PSR 


插入 到 编译 后 的 代码 中 ， 这 样 就 可 以 将 模式 $40 装 入 到 PSR 寄 存 器 中 了 。 


EQU $FFRFFFE0 接收 缓冲 区 

EQU $FFFFFFE3 串 行 接口 的 控制 寄存 器 
EQU $FFFFFFF1 端口 A 输 出 数据 

EQU $FFFFFFF2 端口 A 的 定向 寄存 器 


ORIGIN $1000 


MoveByte #$FFPADIR 配置 端口 A 作为 输出 端口 
Move #INTSERV,$24 设置 中 断 向 量 


Move #$40,PSR 处 理 器 响应 IRQ 中 断 
MoveByte #$10,SCONT 允许 接收 端 中 浙 

* 传送 循环 

LOOP Branch LOOP 无 限 等 待 循环 


* 中 断 服 务 程序 
INTSERV MoveByte RBUF,PAOUT 传送 一 个 字符 到 端口 A 
Retuml 从 中 断 返 回 





图 9-14 使 用 中 断 方式 完成 字符 传送 的 通用 汇编 语言 程序 








第 二 个 问题 是 中 断 服务 程序 ， 这 种 程序 必须 写成 C 程 序 中 的 一 个 函数 。 而 编译 程序 处 理 一 个 
函数 就 像 处 理子 程序 的 过 程 一 样 。 图 9-15 给 


一 个 例子 ， 一 个 主 程序 , 它 执 | #define RBU (volatile char *) OxFFFFFFEO 
出 了 一 个 例 巴 ， 其 中 有 一 个 主 程序 #define PAOUT (char *) OxFFFFFFF! 


行 一 些 任务 ， 这 里 没有 写 出 该 程序 的 任何 
语句 。 还 有 一 个 叫做 intserv 的 函数 ， 它 仅仅 
完成 从 接收 缓冲 区 RBUF 中 向 输出 端口 
FAOUT 传 送 一 个 字符 的 动作 。 编 译 程序 为 | void main0 
图 数 intserv 生 成 以 下 指令 代码 : 

Move $FFFFFFEO, $FFFFFFF1 

ReturnS ) 
现在 看 看 如 果 将 intserv 看 作 一 个 中 断 服 务 程 
序 会 发 生 什么 情况 。 在 使 用 中 断 时 ， 从 中 | ! 
断 服 务 程序 中 返回 必须 使 用 中 断 返 回 指令 *PAOUT = *RBUF; 人 传送 一 个 字符 到 端口 A”/ 
ReturnI。 该 指令 使 得 程序 计数 器 和 处 理 器 L 


void intservO 


状态 寄存 器 恢复 它们 原 有 的 值 。 因 此 ， 我 图 9-15 C 程 序 中 的 一 个 函数 调用 
们 必须 在 程序 中 用 以 下 语句 插入 ReturnI 指 令 : 
__asIm_ . (“ReturnI”) 
所 以 编译 后 的 代码 应 该 是 : 
Move $EFFFFEFFEO0,$FFFFFEFF1 
ReturnI 
ReturnS 


显然 ， 在 这 种 情况 下 RetumS 指 令 将 永远 不 会 被 执行 。 

现在 可 以 写 使 用 中 断 方式 所 需要 的 程序 了 。 图 9-16 给 出 了 一 个 沿用 图 9-11 风 格 的 中 断 处 理 方 
式 的 程序 。 注意， 指向 IO 寄存 器 的 指针 是 字符 型 ， 因 为 它 是 指向 存放 着 1 字 节 数据 的 单元 。 然 
而 指针 int_addr 是 无 符号 整 型 的 ， 因 为 它 指向 一 个 存储 着 4 字 节 中 断 向 量 的 内 存单 元 。 


9.5 WO 设备 的 时 序 限制 


在 以 上 几 节 的 举例 中 由 于 假定 连接 到 端口 A 上 的 输出 设备 比 通过 申 行 口 提 供 字 符 的 设备 要 
快 ， 从 而 使 问题 简化 了 。 在 实际 系统 中 涉及 到 的 设备 会 具有 各 种 不 同 的 速度 。 假 定 我 们 将 以 前 
举例 中 的 速度 做 个 反 向 调整 ， 即 让 输出 设备 比 输入 设备 慢 。 这 就 意味 着 字符 不 能 够 从 RBUF 到 
PAOUT 直 楼 进行 发 送 。 而 是 需要 将 它们 临时 存储 在 内 存 缓冲 区 中 。 这 种 缓冲 区 必须 按 先进 先 出 
(first-in-first-out , FIFO) 队列 组 成 。 简 单 FIFO 的 间 题 是 指向 队列 的 头 和 尾 指 针 被 不 断 地 进行 增 
值 ， 从 而 使 得 该 队列 随 着 字符 的 存储 和 检索 在 整个 存储 区 中 移动 。 一 个 较 好 的 解决 方法 是 使 用 
一 个 环形 缓冲 区 ， 也 就 是 一 个 环形 队列 ， 它 由 固定 数量 的 内 存单 元 构成 并 且 当 到 达 缓 冲 区 末尾 
时 返回 。 当 然 ， 如 果 在 一 个 脉冲 串 里 快速 的 源 设备 生成 的 字符 远 比 在 该 脉冲 串 里 输出 设备 所 能 
接收 的 字符 多 得 多 ， 这 个 缓冲 区 就 会 溢出 。 为 了 避免 出 现 这 种 谥 出 状况 ， 我 们 假定 源 设 备 在 一 
个 脉冲 串 中 生成 的 字符 少 于 80 个 ， 而 输出 设备 在 下 一 个 脉冲 串 到 达 之 前 可 以 接收 这 些 字符 。 这 
就 意味 着 该 环形 缓冲 区 必须 能 够 保存 80 个 字符 。 
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证 定义 寄存 器 地 址 */ 

#define RBUF (volatile char *) OxFFFFFFEO 
#define SCONT (char *) OxXFFFFFFE3 
#define PAOUT (char *) OxFFFFFFF! 
#define PADIR (char *) 

#define int_addr (int *) (Ox24) 


void intserv(); 


void main() 


/* 初始 化 并 行 端口 */ 
*PADIR = 0xFF; 让 配置 端口 A 作为 输出 端口 */ 


f l */ 

int Ad = Rintserv, 六 设置 中 断 向 量 */ 
_asm_("Mo ve #0x40,%PSR"); 产 处 理 器 响应 耻 Q 中 断 */ 
*SCONT = 0x10; 产 允许 接收 端 中 断 */ 


/* 传输 字符 */ 
while (1); 大 无 限 循 环 */ 
} 


上 中 断 服务 程序 */ 

void intserv() 

{ 
*PAOUT = *RBUE; /* 传送 字符 到 端口 A */ 
asm __("ReturnI”); /* 从 中 断 返 回 */ 

} 





图 9-16 使 用 中 断 方式 用 于 字符 传送 的 C 程 序 

我 们 可 以 用 一 个 8 位 的 数组 , 用 两 个 变 址 值 表示 该 队列 头 和 尾 的 当前 位 置 来 实现 环形 缓冲 区 。 
当 这 些 变 址 值 相 等 时 ， 表 示 该 队列 为 空 。 
9.5.1 通过 环形 缓冲 区 做 传送 的 C 程 序 

图 9-17 给 出 了 一 个 使 用 环形 缓冲 区 传送 字符 的 C 程 序 的 例子 。 缓 冲 区 是 一 个 叫做 mbuffer 的 
数组 ， 它 有 80 个 数据 单元 。 字 符 使 用 变 址 fin 存 人 缓冲 区 ， 它 们 通过 使 用 变 址 fout 被 检索 。 每 做 一 
次 循环 ， 首 先 测试 状态 寄存 器 SSTAT， 查 看 在 RBUF 中 是 否 有 一 个 新 的 字符 存在 ， 因 为 从 较 快 的 
设备 中 传送 字符 时 必须 给 予 较 高 的 优先 级 。 如 果 RBUF 中 没有 字符 ， 同 时 环形 缓冲 区 非 空 并 且 端 
口 准备 就 绪 ， 就 向 端口 A 执 行 一 次 传送 。 每 做 一 次 传送 其 变 址 值 就 进行 一 次 更 新 。 


9.5.2 通过 环形 组 冲 区 做 传送 的 汇编 语言 程序 


图 9-18 给 出 了 一 个 用 汇编 语言 实现 的 例子 。 环 形 缓冲 区 使 用 变 址 寻 址 方式 进行 访问 。 寄 存 
器 RO 指向 队列 的 第 一 个 单元 ， 寄 存 器 R1 和 R2 分 别 是 队列 的 首尾 变 址 。 以 下 程序 中 的 主要 内 容 与 
图 9-17 中 的 程序 相同 。 
9.6 反应 计时 器 实例 


前 面 已 经 介绍 了 微 控 制 器 的 基本 特征 ， 现 在 说 明 如 何 将 它 用 在 一 个 简单 的 应 用 中 。 典 型 的 
俊和 式 应 用 例子 将 会 涉及 相当 复杂 的 内 容 ， 所 以 我 们 选择 了 一 个 简单 并 且 容 易 理解 的 任务 。 
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/* Z X šf TE gs Hb hk */ 


#define RBUF (volatile char *) OxFFFFFFEO 
#define SSTAT (volatile char *) OxFFFFFFE2 


#define PAOUT (char *) 0xFFFFFFF1 
#define PADIR (char *) OxFFFFFFF2 


#define PSTAT (volatile char *) OxFFFFFFF6 


#define BSIZE 80 


void main() 

{ 
unsigned char mbuffer[BSIZE]; 
unsigned char fin, fout; 
unsigned char temp; 


/* 初始 化 端口 A 和 环形 缓冲 区 */ 
*PADIR = 0xFF; 

fin = 0; 

fout = 0; 


IER °F */ 
while (1) Í 
while ((*SST AT & 0x1) == 0) { 
if (fin != fout) { 
if (*PSTAT & 0x2) { 


*PAOUT = mbuffer[fout]; 


if (fout < BSIZE - 1) 
fout++; 

else 
fout = 0; 


} 
} 
mbuffer[fin] = *RBUF; 
if (fin < BSZE — 1) 
fin++; 
else 
fin = 0; 
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/* 配置 端口 A 作为 输出 端口 */ 


/* ERIR */ 

A* 等 待 新 字符 */ 

/* 如 果 环 形 缓冲 区 非 帘 */ 
/# 输出 设备 准备 就 绪 */ 

F 发 送 一 个 字符 到 端口 A */ 
六 更 新 输出 变 址 */ 


/* 从 接收 缓冲 区 读 取 一 个 字符 */ 
产 更 新 输入 变 址 */ 


图 9-17 通过 环形 缓冲 区 做 传送 的 C 程 序 


我 们 需要 设计 一 个 “反应 计时 器 ” ， 它 可 以 用 于 测量 人 们 对 于 视觉 刺激 的 反应 速度 。 设 计 思 
想 是 需要 有 一 个 微 控 制 器 去 打开 一 埋 灯 ， 然 后 测量 反应 时 间 ， 即 被 测 者 按 下 开关 关上 灯 的 时 间 。 


详细 的 系统 描述 如 下 : 


“有 两 个 手动 按钮 开关 Go 和 Stop, 一 个 发 光 二 极 管 (LED) 和 一 个 三 位 数字 的 七 段 显 示 器 。 


* 按 下 Go 开关 ， 该 系统 被 激活 。 


“激活 后 ， 七 段 显示 被 设置 成 000， 并 且 LED 是 关闭 的 。 

“ 经 过 三 秒 的 延 时 ，LED 被 打开 并 且 计 时 过 程 开始 。 

e 当 Stop 开 关 按 下 时 ， 计 时 过 程 停止 ，LED 关 闭 ， 并 且 将 经 历 的 时 间 显 示 在 七 段 显示 器 上 。 
* 经历 的 时 间 被 计算 出 来 ， 并 按 百 分 之 一 秒 格式 显示 。 由 于 显示 中 只 有 三 位 数 ， 所 以 假定 经 


历 的 时 间 应 该 是 少 于 10 秒 的 。 
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EQU 接收 缓冲 区 

EQU 串 行 接口 的 状态 寄存 器 
EQU 端口 A 端 出 数据 

EQU 端口 A 的 定向 寄存 器 
EQU 并 行 接口 的 状态 寄存 器 
ReserveByte 定义 环形 缓冲 区 


ORIGIN 

MoveByte . #$FF,PADIR 配置 端口 A 为 输出 端口 
Move #MBUFFER,R0 RO 指向 缓 促 区 

Move #0,R1 初始 化 头 指针 

Move #0,R2 初始 化 尾 指针 


* 传送 字符 

LOOP Testbit #0,SSTAT 检查 是 否 有 新 字符 准备 就 绪 
Branch = 0 READ 
Compare R1,R2 检查 队列 是 否 为 空 
Branch=0 LOOP 队列 为 空 
Testbit #1,PST AT 检查 端口 A 是 否 就 绪 
Branch=0 LOOP 
MoveByte (RO,R2),P AOUT 发 送 一 个 字符 到 端口 A 
Add #1,R2 增加 尾 指 针 
Compare #80,R2 指针 是 否 超 出 队列 的 界限 
Branch<0 LOOP 
Move #0,R2 循环 回来 
Branch LOOP 
MoveByte RBUF,(RO,R1) 将 新 字符 放 人 队列 
Add #1,R1 增加 头 指针 
Compare #80,R1 指针 是 否 超出 队列 的 界限 
Branch< 0 LOOP 
Move #0,R1 循环 回来 
Branch LOOP 





图 9-18 通过 环形 缓冲 区 进行 传送 的 通用 汇编 语言 程序 

图 9-19 描 绘 了 实现 反应 计时 器 所 需 功 能 的 硬件 。 这 里 微 控 制 器 提供 了 除 输入 开关 和 输出 显 
示 以 外 的 所 有 功能 。 

我 们 使 用 并 行 端口 A 和 端口 B 完 成 所 有 的 输入 /输出 功能 。 显 示 时 间 的 前 两 个 有 效 BCD 位 连接 
到 端口 A 上 ， 最 后 一 个 有 效 位 连接 到 端口 B 的 高 四 位 上 。 如 图 所 示 ， 开 关 和 LED 连 接 到 了 端口 B 
的 低 四 位 上 。 计 数 器 /定时 器 电路 用 于 测量 经 历 的 时 间 。 它 由 系统 时 钟 驱动 ， 假 定 系统 时 钟 具有 
100MHz 的 频率 。 

实现 要 求 的 程序 可 以 基于 以 下 方法 完成 : 

* 测试 用 户 的 反应 可 利用 一 个 等 待 循环 监视 程序 完成 ， 在 循环 中 反复 查询 Go 开关 的 状态 。 

“ 当 观 察 到 Go 开关 已 关闭 ， 也 就 是 已 发 现 PB; =0 时 ， 再 延 时 三 种 钟 之 后 打开 LED， 

* 计数 器 设置 成 初始 值 $SFFFFFFFF， 并 且 计 数 过 程 被 激活 ; 每 个 时 钟 脉冲 计数 器 做 递减 

计数 。 

“ 用 循环 等 待 语句 查询 Stop 开 关 的 状态 ， 探 测 用 户 何 时 按 下 开关 做 出 了 反应 。 

* 当 Stop 开 关 按 下 时 ,停止 计数 并 计算 出 经 历 的 时 间 。 

“将 测量 出 的 延 时 时 间 转 换 成 BCD 数 字 ， 并 发 送 到 七 段 显 示 器 上 。 

微 控 制 嚣 中 的 各 种 WO 寄存 器 的 地 址 如 图 9-6 到 图 9-9， 程 序 中 必须 将 端口 A 和 端口 B 配 置 成 图 
9-19 所 示 的 那样 。 端 口 A 的 所 有 位 和 端口 B 的 高 四 位 被 配置 成 输出 。 端 口 B 的 低 四 位 中 的 PBo 和 





PB), 用 做 输入 ， 而 PB; 是 一 个 输出 。 在 两 个 端口 中 不 需要 使 用 控制 信号 ， 因 为 输入 设备 是 由 简单 
的 开关 构成 的 ， 而 输出 设备 是 当 驱 动 器 端口 引 脚 上 的 信号 有 任何 改变 时 就 显示 出 来 的 显示 器 。 








计数 器 /定时 器 = 


微 控制 器 








图 9-19 反应 计时 器 电路 

首先 说 明 如 何 用 C 语 言 程序 实现 此 任务 ， 然 后 再 说 明 如 何 用 汇编 语言 实现 。 

在 两 种 程序 中 都 有 执行 完成 下 列 任务 的 指令 ， 即 当 Go 键 被 按 下 时 ， 用 计时 器 实现 三 秒 钟 的 
延 时 。 由 于 计数 器 /定时 器 电路 的 时 钟 为 100 MHz, 计数 器 要 用 十 六 进 制 数 11E1A300 做 初始 化 ， 
它 相 当 于 十 进 制 数 300 000 000。 递减 计数 过 程 从 CTCONT。 位 被 置 成 1 时 开始 。 当 计数 值 达到 0 时 ， 
LED 打 开 ， 同 时 开始 反应 时 间 的 测试 。 接 着 ， 计 数 器 设 成 FFFFFFFF 开 始 反 应 计时 。 当 测 到 Stop 
键 被 按 下 时 ， 设 置 CTCONT': = 1 停止 计数 过 程 。 总 计数 值 是 这 样 计算 的 : 

总 计数 值 = 0xFFFFFFFF -- 当前 计数 值 
因为 这 是 时 钟 周 期 的 总 数 ， 按 照 百 分 之 一 秒 计算 的 实际 时 间 是 : 
实际 时 间 = (总 计数 值 ) /1000000 
首先 用 100 去 除 这 个 数 ， 将 这 个 二 进 制 整数 转换 成 十 进 制 数 ， 这 样 生 成 最 高 位 有 效 数 。 余数 再 被 
10 除 ， 生 成 下 一 位 有 效 数 ， 最 后 的 余数 是 最 低位 有 效 数 。 


9.6.1 用 于 反应 计时 器 的 C 程 序 


图 9-20 给 出 了 一 个 可 能 的 程序 程序 中 已 将 端口 A 和 端口 B 按 要 求 做 了 设置 ， 并 且 已 关闭 了 
显示 器 和 LED ， 访 程序 轮 询 在 管 脚 PB! 上 的 值 。 在 Go 键 被 按 下 并 且 PB, 变 成 等 于 1 时 ， 插 入 一 个 
三 秒 钟 的 延 时 。 然 后 LED 被 打开 并 且 测 试 反应 计时 过 程 开始 。 另 一 个 轮 询 操作 用 于 等 待 Stop 键 
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产 定 义 寄 存 器 地 址 */ 

#define PAOUT (char *) OxFFFFFFF1 
#define PADIR (char *) OxFFFFFFF2 
#define PBIN (volatile char *) OxFFFFFFF3 
#define PBOUT (char *) OxFFFFFFF4 
#define PBDIR (char *) OxFFFFFFF5 
#define CNTM (int *) OxFFFFFFDO 

#define COUNT (volatile int *) OxFFFFFFD4 
#define CTCON (char *) OxFFFFFFDS 


void main() 
{ 
unsigned int counter_value, total_count; 
unsigned int actual time, seconds, tenths, hundredths; 


A 初始 化 并 行 端口 */ 


*PADIR = OxFF; 六 配置 端 让 A */ 
*PBDIR = 0xF4; t ROB * / 
*PAOUT = 0x0; 上 六 关闭 显示 器 * / 
*PBOUT = 0x4; /* WILED * / 
/* FRR */ 
while (1) { /* 无限 循环 */ 

538 while (PBIN & 0x2) = 0); /* 等 待 Go 键 被 掖 下 */ 


片 等 待 三 秒 钟 然 后 打开 LED */ 


*CNTM = 0x11E1A300; 六 设置 计时 器 值 为 300 000 000 * / 
*CTCONT = Qxl; /* 启动 计时 器 */ 


while ((*CTST AT & 0x1) == 0); 产 等 待 直列 计时 器 到 0 < / 
*PBOUT = 0x0; /* ITH LED 


产 初始 化 计数 器 过 程 */ 

counter value = O; 

*CNTM = 0xFFFFFFFF; MRE < / 
*CTCONT = OQxl; 此 开始 计数 * / 


while ((*PBIN & 0x1) = 0); /* 等 待 Stop 键 被 按 下 */ 


/* Stop 键 被 按 下 ， 停 止 计 数 */ 

*PBOUT = 0x4; 刻 关 闭 LED */ 
“CICONT = 0x2; 户 停 止 计数 器 */ 
counter.value = *COUNT, 启 读 取 计 数 器 的 内 容 */ 
上 * 计 算 总 的 计数 值 */ 

total count = (OxFFFFFFFF — counter value); 


上 将 计数 转换 为 时 间 */ 

actual time = total_count / 1000000; 产 以 1100 秘 为 单位 的 时 间 */ 
seconds = actual_time / 100; 

tenths = (actual time — seconds * 100) / 10; 

hundredths = actualtime ~ (seconds * 100 + tenths * 10); 


/* ERD ja] */ 
*PAOUT = ((seconds << 4) | tenths); 4 
*PBOUT = ((hundredths << 4) 1 0x4); /* F$LED3: H] */ 





图 9-20 用 于 反应 计时 器 的 C 程 序 
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释 的 那样 完成 经 历时 间 的 计算 ， 并 将 其 转换 成 十 进 制 数 。 最 后 的 结果 是 三 个 BCD 数 据 被 整理 并 
写 到 对 应 的 端口 数据 寄存 器 中 ， 如 图 9-19 中 的 描述 。 


9.6.2 用 于 反应 计时 器 的 汇编 语言 程序 


图 9-21 给 出 了 针对 反应 计时 器 问题 用 汇编 语言 实现 的 程序 。 它 是 基于 9.6 节 开始 部 分 的 总 体 
设计 原则 并 仿照 图 9-20 中 的 C 程 序 编写 的 。 其 中 对 每 个 指令 都 给 出 了 注释 语句 以 便于 读者 可 以 理 
解 程序 的 过 程 。 

转换 成 BCD 表 示 方 式 需要 使 用 除法 指令 ， 该 指令 已 在 2.10.3 节 中 讨论 过 。 这 个 指令 用 在 寄存 
器 R2 中 的 “被 除数 ” 除 以 寄存 器 Ri 中 的 “除数 " 。 运 算 结 果 “ 商 ” 放 在 R2 中 ,“ 余 数 ” 放 在 R3 中 。 
注意 被 100 除 过 以 后 的 实际 时 间 ( 按 1100 秒 表示 )， 可 以 考虑 的 只 有 在 R2 的 商 中 的 最 后 四 位 有 效 
数 。 我 们 已 假定 经 历时 间 应 该 小 于 10 秒 ， 所 以 只 有 三 个 数字 需要 显示 。 商 的 第 一 位 数字 被 移 到 
了 R4 中 。 其 余 的 数 从 R3 移 到 了 R2 中 ， 并 且 下 次 执行 除 以 10 的 操作 。 


端口 A 输出 数据 
端口 定向 寄存 器 
端口 B 输 入 3 引 脚 
端 日 B 输 出 数据 
端口 B 定 向 寄存 器 
初始 计数 器 值 
计数 器 内 容 
控制 寄存 器 


配置 端口 A 
配置 端口 B 
关闭 显示 器 
通过 使 PB;= 1 关闭 LED 


MoveByte #$F4,PBDIR 


#0,PAOUT 
#4,PBOUT 


START MoveByte 


MoveByte 


+ 等 待 Go 键 被 按 下 
GKEY Testbit 
Branch=0 


#1,PBIN 
GKEY 


Go 键 与 引 脚 PB, 相 连 


* 在 LED 被 打开 LED 之 前 延迟 三 秒 





Move 
MoveByte 
DELAY Testbit 
Branch=0 
MoveByte 


* 初始 化 计数 过 程 


Move 
MoveByte 


* 等 待 Stop 键 被 按 下 
SKEY Testbit 
Branch=0 


#11E1A300,CNTM 
#1,CTCONT 
#0,CTCONT 
DELAY 
#0,PBOUT 


#$FFFFFFFF,CNTM 
#1,CTCONT 


#0.PB 
SKEY 





计时 器 值 为 300 000 000 
启动 计时 器 
等 待 直 定 计时 器 为 0 


打开 LED 


设置 起 始 计数 器 值 
开始 计数 


Stop 键 连接 到 PBo 引 脚 


图 9-21 使 用 轮 询 方式 的 反应 计时 器 的 汇编 语言 程序 
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* 停止 计数 并 读 取 最 后 的 计数 值 
MoveByte #4,PBOUT 通过 使 PB,=1， 关 闭 LED 
MoveByte #2.CTCONT 停止 计数 器 
Move COUNT,RO 读 取 计 数 器 


* 计算 总 的 计数 值 
Move #$FFFFFFFFR2 确定 实际 的 计数 值 
Subtract RO,R2 


* 将 计数 值 转换 为 以 /100 秒 表示 的 实际 时 间 ， 然 后 转换 成 BCD 数 

* 将 2 个 最 高 位 BCD 数 字 放 入 寄存 器 R4， 最 低位 BCD 数 字 放 入 R3 
Move #1000000,R1 确定 1/100 秒 数 
Divide 
Move 除 以 10 得 到 表示 种 数 的 数字 
Divide 
Move 保存 这 个 数字 到 R4 中 
Move 将 余数 作为 下 一 个 被 除数 
Move 除 以 10 得 到 表示 1/10 秒 数 的 数字 
Divide 
LShiftL , 前 2 个 BCD 数 字 放 入 R4 
Or 


* 显示 经 历 的 时 间 
MoveByte R4,PAOUT 前 2 个 数字 输入 到 端口 A 


LShiftL #4,R3 第 3 个 数字 到 端口 B 并 保持 LED 关 闭 
Or #4,R3 

MoveByte R3,PBOUT 

Branch START 下 一 次 测试 准备 就 结 





图 9-21 (#) ` 


表示 所 用 时 间 的 秒 数 和 1/10 秒 数 的 BCD 数 字 被 存放 到 了 R4 中 的 最 低 字 节 中 ， 并 被 发 送 到 端 
口 A 上 去 显示 。 第 三 个 数字 表示 1/100 秒 的 计数 ， 它 被 移 到 了 R3 的 R37-s 位 上 。 由 于 R3 中 的 此 内 容 
要 发 送 到 端口 8 上 ， 它 还 需要 设置 R33= 1， 以 保证 LED 是 关闭 的 。 


9.6.3 最 后 评价 


反应 计时 器 是 计算 机 控制 应 用 的 一 个 非常 完整 的 例子 ， 与 以 前 各 章 中 的 例子 相 比 ， 它 典型 
地 说 明了 计算 机 系统 的 独立 特性 。 

编写 企 人 式 系 统 软 件 的 一 个 重要 特征 就 是 它 必 须 与 硬件 紧密 相关 。 术 语 反 应 系统 经 常用 于 
描述 这 样 的 事实 : 在 一 个 时 间 点 上 由 处 理 器 的 外 部 事件 来 决定 多 个 程序 中 哪 一 个 将 被 执行 ， 比 
如 关闭 一 个 开关 或 是 在 输入 端 上 收 到 了 一 个 字符 这 样 的 事件 。 就 像 在 第 4 章 中 讨论 的 那样 ， 有 两 
种 机 制 可 以 用 于 协调 这 些 交 互 过 程 一 - 轮 询 和 中 断 。 软 件 设计 者 必须 决定 这 些 交 互 过 程 应 如 何 
完成 。 


9.7 顽 入 式 处 理 器 系列 


我 们 已 经 在 9.3 节 给 出 了 一 个 幅 入 式 处 理 器 的 例子 ， 并 在 9.6 节 中 给 出 了 一 个 简单 应 用 举例 ， 
现在 简要 地 来 讨论 一 些 商用 芯片 。 许 多 嵌入 式 应 用 不 需要 功能 很 强 的 处 理 器 ， 显 然 ，9.1.1 节 中 
讨论 的 微波 炉 就 不 需要 功能 强大 的 控制 器 ， 因 为 它 需 要 的 计算 很 简单 。 针 对 这 样 的 应 用 最 好 是 





使 用 这 样 一 种 芯片 ， 它 包括 一 个 简单 的 处 理 器 ， 但 同时 还 含有 足够 的 内 存 资 源 ， 这 样 使 用 这 个 
单独 的 芯片 就 可 以 实现 所 有 的 控制 功能 。 在 9.1.2 节 中 讨论 的 数字 照相 机 有 很 多 较 高 的 计算 需求 ， 
因此 它 就 需要 使 用 一 个 功能 比较 强 的 处 理 器 。 

处 理 器 可 以 用 访问 内 存 数 据 时 能 够 并 行 处 理 多 少 位 来 标志 其 性 能 。 目 前 最 强大 的 微 控制 器 
包含 有 一 个 32 位 的 微 处 理 器 、 一 个 32 位 宽 的 数据 总 线 。 某 些微 控制 器 是 基于 ARM 体 系 结构 建立 
的 。 也 有 可 能 是 某 个 处 理 器 有 一 个 内 部 的 32 位 结构 ， 但 对 于 存储 器 只 有 16 位 的 数据 总 线 。 微 控 
制 器 Motorola 683xx 系 列 就 是 这 样 的 例子 ， 它 拥有 一 个 基于 68000 的 处 理 器 核 。 这 样 的 设备 被 归 
类 为 16 位 的 微 控 制 器 。 最 流行 的 微 控 制 器 是 8 位 芯片 。 它 们 非常 便宜 ， 同 时 功能 足 可 以 满足 大 量 
做 入 式 应 用 的 需要 。 还 有 较 小 的 4 位 芯片 ， 由 于 非常 简单 并 且 非 常 廉价 ， 所 以 也 极 具 吸引 力 。 


9.7.1 基于 Intel 8051 的 微 控 制 器 


早 在 1980 年 ，Intel 公 司 推出 了 一 款 称 为 8051 的 微 控 制 器 芯片 。 这 个 芯片 具有 Intel 8080 微 处 
理 器 系列 的 基本 体系 结构 ， 它 使 用 8 位 芯片 ， 可 用 于 通用 计算 的 应 用 中 。8051 芯 片 得 到 了 快速 的 
普及 。 它 已 成 为 在 实际 中 使 用 最 为 广泛 的 芯片 之 一 。8051 有 四 个 8 位 /0 端口、 一 个 UART 和 两 个 
16 位 的 计数 器 /定时 器 电路 。 它 还 包含 有 4K 字 节 的 ROM 和 128 字 节 的 RAM 存 储 单 元 。 同 种 芯片 的 
EPROM 版 本 中 包含 有 4K 字 节 的 EPROM 而 不 是 ROM， 它 被 命名 为 8751。 

还 有 许多 基于 8051 体 系 结构 的 芯片 ; 它们 进行 了 不 同 程度 的 改进 。 例 如 ，8052 芯 片 有 8K 字 
节 的 ROM 和 256 字 节 的 RAM， 还 有 一 个 附加 的 计数 器 /定时 器 电路 。 它 的 EPROM 版 本 是 8752。 

微 控制 器 芯片 可 以 用 NMOS 或 CMOS 技 术 进 行 构造 。CMOS 设 备 有 功 耗 低 的 优势 ， 因 此 它们 
对 于 使 用 电池 驱动 的 应 用 系统 非常 具有 吸引 力 。 以 上 微 控 制 器 的 CMOS 版 本 有 著名 的 80C51 和 
80C52, 

8051 体 系 结构 由 Intel 公 司 开 发 。 后 来 ， 许 多 半导体 制造 商 生产 的 芯片 要 么 是 与 8051 系 列 完 
全 相同 ， 要 么 是 在 性 能 上 做 了 一 些 提高 但 与 它 完全 兼容 。 从 一 个 媒人 式 应 用 的 设计 者 观点 来 看 ， 
有 第 二 种 可 用 芯片 的 来 源 是 件 好 事 ， 因 为 这 样 可 以 保证 芯片 的 高 度 可 用 性 和 价格 上 的 竞争 性 。 


9.7.2 Motorola 微 控制 器 


在 1980 年 ，Intel 和 Motorola 作 为 半导体 芯片 制造 商 ， 它 们 占据 着 主导 地 位 。 最 流行 的 8 位 微 
处 理 器 成 为 了 微 控制 器 的 基础 。 基 于 不 同 的 处 理 器 核 ， 有 各 种 各 样 的 Motorola 微 控制 器 。 

68HC11 微 控制 器 

Motorola 最 流行 的 8 位 微 处 理 器 是 6800 和 6809。 执 行 的 指令 集 是 6800 指 令 集 的 超 集 ， 微 控制 
器 心 片 称 为 66HC11 。 该 微 控 制 器 有 五 个 可 以 用 于 各 种 目的 的 MO 端 口 。UVO 结 构 中 包括 两 个 串 行 
接口 : 一 个 是 异步 的 ， 一 个 是 同步 的 。 异 步 接 口 使 用 在 10.3.1 节 中 讨论 的 起 止 协议 。 同 步 接口 实 
现 了 冲 行 外 图 设备 接口 (SPT)。 可 以 将 八 个 模拟 输入 连接 到 68HC11 上， 因为 这 个 芯片 具有 执行 
A/D 转 换 的 能 力 。 它 还 有 可 以 完成 不 同方 式 的 计数 操作 的 计数 器 /定时 器 电路 。 

在 68HC11 芯 片 中 包含 的 存储 器 总 量 与 具体 的 型 号 有 关 。 典 型 的 规格 为 ， 在 基本 型 芯片 中 ， 
有 一 个 8K 字 节 的 ROM、 一 个 512 字 节 的 EEPROM 和 一 个 256 字 节 RAM; 在 较 高 级 的 芯片 中 ， 有 
一 个 12K 字 节 的 ROM、 一 个 512 字 节 的 EEPROM 和 一 个 512 字 节 RAM。 

683xx 微 控制 器 

683xx 系 列 的 微 控制 器 是 基于 68000 处 理 器 核 构成 的 。 这 些 芯 片 包含 有 并 行 和 串 行 接口 、 计 
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数 器 /定时 器 以 及 A/D 转 换 电路 。 片 上 存储 器 总 量 因 芯 片 不 同 而 不 同 。 比 如 ，68376 芯 片 有 一 个 8K 
字 节 EEPROM 和 一 个 4K 字 节 的 RAM 

ColdFire 微 控制 器 

68000 指 令 集 体系 结构 为 MCF5xxx 微 控制 器 一 一 著名 的 ColdFire 代 人 式 处 理 器 提供 了 基础 。 
它们 的 特殊 之 处 在 于 使 得 性 能 得 到 大 大 提高 的 流水 线 结构 。 其 实现 了 完全 的 32 位 总 线 模 式 。 
ColdFire 处 理 器 核 主要 是 为 了 用 于 片上 系统 (system-on-a-chip) 环境 而 设计 的 ， 这 些 将 在 9.9 节 中 
讨论 。 

PowerPC 微 控制 器 

IMotorola 的 高 端 微 处 理 器 是 著名 的 PowerPC， 它 是 基于 RISC 体 系 结构 建立 的 。 目 前 也 可 以 见 
到 以 这 种 处 理 器 体系 结构 建立 的 微 控制 器 ， 比 如 包括 MPC5xx 系 列 在 内 的 芯片 。 


9.7.3 ARM 微 控制 器 


在 第 3 章 中 给 出 的 ARM 体 系 结构 对 于 嵌入 式 系统 是 具有 吸引 力 的 ， 它 具有 可 靠 的 计算 能 力 ， 
并 且 造 价 和 功 耗 也 相对 比较 低 。 它 的 一 个 主要 目标 是 使 得 ARM 处 理 器 的 设计 适合 于 片上 系统 
(system-on-a-chip) 的 环境 。ARM 微 控制 器 也 可 以 作为 一 个 单独 的 芯片 使 用 。 

ARM 处 理 器 核 已 经 有 了 一 系列 用 于 嵌入 式 应 用 的 产品 ， 包 括 ARM6、ARM7、ARM9 和 
ARM10。 基 本 的 ARM 结 构 使 用 32 位 的 体系 结构 ， 并 且 其 中 的 所 有 指令 是 32 位 长 的 指令 集 。 还 存 
在 另 一 种 版 本 ， 称 为 Thumb (拇指 ) 型 ， 它 使 用 16 位 的 指令 和 16 位 的 数据 传递 。Thumb 版 本 使 用 
的 是 ARM 指 令 的 子 集 ， 该 子 集 被 编码 并 代入 到 16 位 的 格式 中 。 它 包含 有 比 ARM 体 系 结构 少 一 些 
的 寄存 器 。Thumb 的 优势 是 在 大 多 数 情况 下 只 需要 使 用 相当 小 的 存储 器 来 存储 程序 ， 因 为 这 些 程 
序 是 使 用 高 度 编码 的 16 位 指令 构成 的 。 在 执行 时 ， 每 个 Thumb 指 令 被 扩展 成 正常 的 32 位 ARM 指 
令 。 这 样 ， 一 个 Thumb 型 的 ARM 核 中 除了 正常 电路 外 ， 还 包含 有 一 个 Thumb 解 压缩 装置 。 

ARM 体 系 结构 和 处 理 器 核 已 经 由 ARM 公 司 开 发 出 来 , 许多 其 他 的 公司 也 被 授权 提供 这 种 核 。 
一 些 公司 像 Atmel 公司 、Sharp Electronics 公司 及 Samsung 半 导体 研究 所 也 生产 基于 ARM 核 的 微 
控制 器 芯片 。 例 如 ，Atmel 的 AT91F40416 微 控制 器 使 用 ARM7-TDMI Thumb-aware 核 ， 它 还 包含 
有 4K 字 节 的 RAM、526K 字 节 的 闪存 (Flash ROM)、32 位 可 编程 1O 线 、2 个 申 行 口 和 I 个 计数 器 / 
定时 器 电路 ， 


9.8 设计 问题 


一 个 嵌 人 式 系统 的 设计 者 必须 做 出 许多 重要 的 决定 。 对 实际 应 用 或 是 将 要 设计 的 产品 的 特 
性 提出 了 特定 的 要 求 和 限制 ， 在 本 节 中 我 们 将 考虑 设计 者 要 面 对 的 一 些 最 重要 的 问题 。 

成 本 . 

在 许多 做 入 式 应 用 中 电路 的 成 本 必须 是 低廉 的 ， 廉 价 的 解决 方案 体现 在 是 否 能 够 用 单个 微 
控制 器 世 片 实现 所 有 必须 提供 的 功能 。 当 有 足够 的 HO 能 力 和 有 充足 的 片上 存储 器 来 存放 需要 的 
软件 时 ， 做 到 这 一 点 是 可 能 的 。 

WO 能 力 

微 控制 器 芯片 提供 多 种 WO 资源 。 这 个 范围 包括 从 简单 的 并 行 和 品行 端口 到 计数 器 、 定 时 器 、 
A/D 及 D/A 转换 电路 等 扩展 性 支持 设备 。 

可 用 的 WO 线 数 是 重要 的 ， 没 有 足够 的 1O 线 时 需要 使 用 外 部 电路 去 补充 它 。 这 些 已 经 在 图 





9-19 的 反应 计时 器 中 作 了 说 明 ， 其 中 扩展 译 码 器 电路 用 于 驱动 由 微 控制 器 提供 的 4 位 BCD 信 号 的 
七 段 显示 器 。 如 果 微 控制 器 有 四 个 而 不 是 两 个 并 行 端口 ， 那 么 就 可 以 将 每 个 七 段 显 示 器 与 一 个 
端口 相连 。 控 制程 序 可 以 更 直接 地 生成 显示 过 程 中 驱动 各 个 段 所 需要 的 输出 信和 号 。 

规格 

微 控制 器 芯片 有 各 种 不 同 的 规格 ， 如 果 一 个 应 用 中 可 以 用 8 位 微 控制 器 做 处 理 ， 就 没有 必要 
使 用 16 位 芯片 ， 否 则 它 就 会 变 得 价格 比较 昂贵 、 实 际 尺 寸 增 大 并 且 功 耗 加 大 。 大 部 分 的 实际 应 
用 可 以 使 用 相对 较 小 的 芯片 进行 处 理 。 最 近 这 些 年 芯片 销售 量 最 大 的 是 8 位 类 型 ， 紧 随 其 后 的 是 
4 位 和 16 位 类 型 。 

就 忆 片 占用 印刷 电路 板 面积 而 言 ， 芯 片 的 实际 大 小 很 重要 。 这 个 面积 是 所 含 费用 中 的 主要 
部 分 。 

功 耗 

功 耗 在 所 有 的 计算 机 应 用 中 是 一 个 需要 重点 考虑 的 内 容 。 高 性 能 的 系统 其 功 耗 也 会 变 得 很 
高 ， 需 要 增加 一 些 机 制 来 驱散 产生 的 热量 。 在 许多 媒人 式 应 用 中 消耗 的 能 量 很 低 ， 所 以 不 用 担 
心 散 热 问题 。 但 是 ， 这 些 应 用 通常 是 电池 电源 产品 ， 所 以 电池 的 寿命 (根据 功 耗 决定 ) 是 主要 
的 因素 。 

如 果 使 用 CMOS 技 术 构 造 微 控 制 器 芯片 ， 其 功 耗 就 会 降低 。 在 CMOS 技 术 中 ， 功 耗 与 时 钟 频 
率 成 正比 。 如 果 低 性 能 可 以 满足 指定 的 应 用 ， 就 可 以 降低 时 钟 频率 来 降低 功 耗 。 另 一 种 可 能 采 
用 的 折 中 方法 是 与 微 控 制 器 芯片 的 功能 有 关 的 ， 降 低 功能 意味 着 减少 芯片 上 的 电路 ， 这 样 也 就 
降低 了 功 耗 。 

片上 存储 器 

微 控 制 器 芯片 中 包含 的 内 存 使 得 简单 嵌入 式 应 用 可 以 使 用 单个 芯片 来 实现 。 存 储 器 的 大 小 
和 类 型 有 很 大 的 差异 。 相 对 少量 的 RAM 可 能 对 于 计算 中 的 数据 存储 是 足够 的 。 大 量 的 只 读 存 储 
器 可 用 于 存储 程序 ， 这 种 存储 器 可 以 是 ROM、PROM、EPROM、EEPROM 或 闪存 ， 它 们 的 价格 
依次 递增 。 对 于 大 容量 的 产品 ， 最 为 经 济 的 选择 是 采用 带 ROM 的 微 控制 器 。 但 是 ， 这 也 是 一 种 
最 不 灵活 的 选择 ， 因 为 ROM 中 的 内 容 是 在 芯片 制造 时 被 永久 实现 了 的 。PROM 和 EPROM 型 存储 
器 可 以 在 嵌 和 人 式 产品 制作 时 进行 编程 。 最 灵活 的 应 用 是 由 EEPROM 和 办 存 提供 的 存储 方式 ， 它 
们 可 以 被 多 次 编程 。 

对 于 计算 要 求 比较 高 的 应 用 ， 需 要 使 用 外 部 存储 器 。 有 些微 控制 器 不 包含 任何 的 片上 存储 
器 ， 它 们 通常 用 于 存储 总 量 非 常 大 ， 不 能 在 微 控制 器 芯片 内 部 实现 的 复杂 应 用 中 。 

性 能 

当 微 控制 器 在 家 用 设备 和 玩具 中 使 用 时 ， 除 了 像素 尼 PlayStation 中 的 电视 游戏 以 外 ， 性 能 通 
常 不 是 个 大 问题 。 在 这 种 情况 下 可 以 选择 小 型 并 且 便 宜 的 芯片 。 但 是 ， 在 移动 电话 和 手掌 游戏 
机 的 应 用 中 就 需要 有 非常 高 的 性 能 。 高 性 能 就 需要 比较 强大 的 芯片 ， 这 也 必 将 带 来 高 费用 和 较 
大 的 荔 耗 。 由 于 这 些 应 用 通常 是 用 电池 做 电源 的 ， 降 低 功 耗 是 最 为 重要 的 。 在 第 3 章 中 我 们 讨论 
了 ARM 体 系 结构 。 实 现 这 种 结构 的 一 种 范例 是 StrongARM 芯 片 ， 它 专门 被 设计 成 低 功 耗 旦 有 恨 
好 性 能 的 产品 。9.7.3 节 中 讨论 的 ARM 体 系 结构 的 Thumb 版 本 ， 其 目的 是 为 了 用 于 岁入 式 应 用 ， 
在 这 些 应 用 中 成 本 和 性 能 问题 是 关键 。 

软件 


使 用 高 级 语言 编写 计算 机 应 用 程序 有 许多 优势 ， 它 们 使 程序 开发 过 程 变 得 简单 并 且 使 将 来 
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的 软件 维护 和 修改 工作 更 加 容易 。 但 是 ， 在 有 些 情 况 下 求助 于 汇编 语言 可 能 会 更 加 理想 。 使 用 
汇编 语言 编写 的 程序 可 能 生成 的 目标 码 会 比 由 编译 程序 生成 的 代码 压缩 10%~20% (就 存储 需要 
的 总 量 来 讲 )。 如 果 一 个 侯 入 式 应 用 是 基于 具有 片上 存储 器 的 微 控制 器 而 建立 的 ， 那 么 可 以 将 所 
需 的 代码 放 进 内 部 存储 器 中 ， 而 避免 使 用 外 部 存储 器 ， 这 就 成 了 使 用 汇编 语言 的 主要 优势 。 

设计 者 应 该 仔细 而 恰当 地 估计 所 得 到 的 片上 RAM 的 容量 。 这 种 存储 器 通常 用 于 存储 动态 数 
据 ， 就 像 一 个 临时 缓冲 区 ， 或 是 用 于 实现 堆栈 。 编 写 看 似 紧 炭 的 代码 是 容易 做 到 的 ， 例 如 使 用 C 
语言 ,但 是 它 需 要 的 RAM 比 可 用 的 要 多 一 些 。 

指令 集 

另 一 个 重要 的 问题 是 处 理 器 所 使 用 指令 集 的 特性 。CISC 类 指令 比 RISC 类 指令 产生 更 多 紧凑 
型 的 代码 。 因 此 ， 处 理 器 的 选择 对 代码 的 大 小 也 有 影响 。 由 ARM 体 系 结构 的 Thumb 版 本 提供 了 
一 个 有 趣 的 例子 ， 为 32 位 处 理 器 设计 的 RISC 类 指令 集 已 经 修改 成 了 用 于 16 位 指令 的 高 度 编码 集 。 
为 Thumb 版 本 编写 的 程序 与 用 完全 ARM 体 系 结构 编写 的 程序 相 比 ， 其 达到 了 30% 的 紧缩 效果 。 
指令 在 执行 时 被 恢复 ，Thumb 指 令 被 扩展 成 正常 的 ARM 指 令 ， 就 像 在 9.7.3 节 中 解释 的 那样 。 

开发 工具 

数字 系统 的 设计 者 对 开发 工具 的 依赖 性 很 强 。 这 些 开发 工具 包括 计算 机 辅助 设计 (CAD) 
软件 包 、 操 作 系 统 软 件 、 编 译 程序 、 汇 编程 序 及 处 理 器 的 模拟 器 。 开 发 工具 的 范围 和 可 用 性 通 
常 依赖 于 所 选择 的 嵌入 式 处 理 器 。 有 第 三 方 支持 也 是 非常 具有 吸引 力 的 ， 因 为 在 第 三 方 那里 有 
工具 和 文档 资料 。 有 效 的 文档 和 来 自 于 制造 商 的 建议 (如 果 需 要 的 话 ) 是 非常 宝贵 的 。 

可 测试 性 和 可 靠 性 

印刷 电路 板 通常 是 很 难 测试 的 ， 尤 其 在 高 密度 地 使 用 芯片 时 更 是 如 此 。 如 果 将 整个 系统 设 
计 成 容易 测试 的 方式 ， 那 么 测试 过 程 就 会 大 大 简化 。 一 个 微 控制 器 芯片 可 以 包含 一 些 电路 ， 这 
些 电 路 可 以 使 包含 该 芯片 的 印刷 电路 板 比较 容易 测试 。 例 如 ， 在 有 些微 控制 器 中 包含 有 一 个 测 
试 端口 ， 它 与 用 于 可 测试 结构 的 下 EE 1149.1 标 准 兼容 ， 该 标准 是 以 测试 访问 端口 及 边界 扫描 结 
构 中 而 闻名 的 。 

嵌入 式 应 用 要 求 具有 稳健 性 和 可 靠 性 。 一 个 典型 产品 的 生命 周期 希望 最 少 可 达到 5 年 以 上 。 
这 一 点 与 个 人 计算 机 不 同 ， 个 人 计算 机 容易 在 短期 内 被 淘汰 。 


9.9 片上 系统 


在 一 个 幅 入 式 应 用 中 ， 尽量 使 用 少量 的 芯片 是 可 取 的 。 理 想 的 情况 是 单个 芯片 可 以 实现 整 
个 系统 。 在 比较 简单 的 应 用 中 ,用 那些 可 获得 的 商用 微 控制 器 实现 所 有 需要 的 功能 是 可 能 做 到 
的 。 但 是 在 比较 复杂 的 应 用 中 就 不 行 了 。 有 些微 控制 器 芯片 以 特殊 应 用 为 目标 ， 这 些 特殊 应 用 
很 难 使 用 通用 微 控制 器 去 实现 。 例 如 ， 一 个 用 于 视频 游戏 的 微 控 制 器 应 该 包含 视频 和 声音 处 理 
电路 。 这 些 需 求 与 用 于 激光 打印 机 或 是 移动 电话 中 的 微 控 制 器 是 完全 不 同 的 。 

开发 一 个 复杂 的 微 控 制 器 是 一 件 需要 花费 时 间 且 具有 挑战 性 的 任务 。 但 是 ， 大 部 分 消费 品 
的 开发 时 间 又 必须 要 尽量 短 。 如 果 设计 者 可 以 利用 一 些 已 有 的 电路 模块 ， 而 这 些 模块 可 以 得 到 
并 且 易于 使 用 ， 那 么 一 个 为 了 特殊 应 用 而 实现 的 完整 系统 芯片 就 可 以 在 相对 短 的 时 间 里 设计 出 
来 。 微 处 理 器 核 是 所 需 模 块 之 一 。 这 些 核 可 以 通过 一 个 使 用 权限 许可 来 获得 。 其 他 的 用 于 实现 
存储 、A/D 和 D/A 转换 的 电路 或 DSP (数字 信号 处 理 ) 电路 的 模块 也 可 以 得 到 。 设 计 者 可 以 通过 
使 用 这 些 模块 设计 出 其 余 所 需 的 电路 并 完成 设计 。 
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在 9.7.3 节 中 ， 我 们 曾 提 到 ARM 的 核 已 经 设计 成 大 型 系统 的 一 个 模块 。 另 一 个 有 趣 的 例子 是 
National Semiconductor 公 司 的 CompactRISC 核 ， 它 的 一 个 特性 是 具有 从 3 位 到 64 位 的 可 伸缩 性 。 它 
有 一 个 简单 的 3 段 流水 线 、 一 个 40K 字 节 ROM 和 1.4K 字 节 RAM 的 片上 存储 器 。 只 有 当 还 需要 外 部 
存储 器 时 才 添加 一 个 总 线 接口 单元 。 这 样 ， 核 的 复杂 性 可 以 调整 ， 并 与 应 用 要 求 的 功能 相 适 应 。 

系统 核 和 其 他 模块 的 提供 者 是 在 销售 他 们 的 设计 而 不 是 芯片 ， 实 际 上 ， 他 们 是 在 销售 一 种 
思想 而 不 是 实际 的 部 件 。 其 产品 是 典型 的 知识 产权 (IP) 的 例子 ， 这 些 产品 可 以 被 其 他 人 用 来 
设计 自己 的 芯片 。 


FPGA 的 实现 


现场 可 编程 门 阵列 (FPGA) 提供 了 一 种 在 单个 芯片 上 实现 系统 的 有 效 手段 。 它 不 是 像 微 处 
理 器 局 片 那 样 为 设计 者 提供 一 个 预定 好 的 功能 单元 , FPGA 设 备 在 设计 阶段 可 以 完全 自由 地 进行 。 
它们 可 以 很 容易 做 到 包含 某 个 标准 单元 ， 然 后 按照 需求 构造 系统 的 其 余部 分 。 为 了 说 明 这 种 方 
站 的 典型 特点 ， 我 们 将 对 Altera Corporation 的 Excalibur 系 统 进行 分 析 。 

FPGA 功 能 性 能 力 已 经 有 了 窒 飞 猛 进 的 增强 。 单 个 大 型 FPGA 芯 片 可 以 实现 一 个 需要 数 十 万 
个 逻辑 门 来 完成 的 系统 。 这 样 的 芯片 已 经 足 可 以 满足 微 控 制 器 和 在 系统 中 所 需要 的 其 他 电路 实 
现 的 典型 功能 。 

任何 一 个 片上 系统 的 核心 构件 是 处 理 器 核 。Excalibur 系 统 给 出 两 种 不 同 的 选择 : 一 个 是 相 
关 的 处 理 器 ， 它 是 用 软件 定义 的 ; 另 一 个 所 涉及 的 处 理 器 为 FPGA 芯 片 ， 它 是 制造 过 程 中 在 硅 片 
上 实现 的 处 理 器 核 。 

软 处 理 器 核 

Excalibur 系 统 提供 一 个 软件 模块 ， 它 用 Verilog 硬 件 描述 语言 写成 ， 所 实现 的 处 理 器 体系 结 
构 称 为 Nios。 这 种 体系 结构 多 许 设 计 才 将 处 理 器 措 术 成 库 中 的 任意 一 个 模 氛 ， 这 些 库 中 的 入 所 
可 以 用 两 种 方式 完成 ， 一 种 是 硬件 描述 语言 比如 Verilog 或 VHDL， 或 是 在 原理 图 输入 时 用 功能 块 
完成 。 设 计 者 可 以 根据 系统 的 性 能 需要 来 选择 32 位 或 16 位 的 处 理 器 。 

9.3.1 节 中 描述 的 并 行 接口 模块 是 一 个 有 效 的 参数 化 库 模块 。 用 户 可 以 具体 指明 参数 ， 使 其 
适合 于 设计 的 要 求 。 寄 存 器 的 长 度 可 以 在 1 到 32 位 范围 内 选择 。 用 户 可 以 选择 完全 双向 的 接口 或 
是 有 一 定 限制 的 接口 方式 。 例 如 ， 可 以 指定 仅 作为 输出 的 端口 ， 在 这 种 情况 下 只 指明 了 输出 数 
据 寄 存 器 ， 而 输入 通道 和 数据 定向 寄存 器 是 不 生效 的 。 这 样 使 得 FPGA 的 资源 不 会 浪费 在 不 需要 
的 部 件 中 。 

串 行 搂 口 可 以 用 UART 电 路 的 形 起 获得 。 设计 者 指明 所 需 的 参数 ， 例 如 数据 位 的 位 数 、 停 止 
位 位 数 以 及 使 用 哪 种 奇偶 校 验 位 : 从 预定 义 的 标准 范围 内 选择 传送 /接收 时 钟 频率 。 这 一 频率 可 
以 在 以 后 根据 应 用 软件 需要 用 一 个 内 部 的 除数 寄存 器 来 改变 ， 访 寄存 器 可 以 装 入 用 来 划分 时 钟 
频率 的 值 。 用 户 仍然 可 以 只 选择 需要 的 功能 并 只 实现 相应 的 电路 。 f 

定时 器 组 件 提供 的 计数 和 定时 能 力 在 9.3.3 节 中 作 了 描述 。 它 的 操作 完全 由 应 用 软件 进行 控制 。 

大 型 FPGA 世 片 包含 相 当 大 最 的 存储 器 ， 这 些 存储 块 可 以 用 于 实现 当 存储 器 容量 需求 不 太 大 
时 候 和 人 式 系统 中 的 RAM 和 ROM 部 件 。 设计 者 可 以 按照 字数 和 每 个 字 的 位 数 说 明 需 要 内 存 的 容量 。 
如 果 片 上 存储 资源 不 够 ， 可 以 说 明 一 个 外 部 存储 接口 ， 这 将 导致 在 FPGA 芯 片 的 引 脚 上 实现 相应 
的 存储 总 线 信 号 。 

ExcaliburCAD 工 具 使 得 在 FPGA 上 设计 系统 变 得 更 加 容易 。 该 工具 中 包含 一 个 向 导 程序 ， 它 
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提示 设计 者 输入 需要 的 参数 ， 然 后 为 设计 者 生成 指定 电路 。 因 此 ， 处 理 器 和 IO 模块 可 自动 实现 。 
它们 被 一 个 类 总 线 结构 (用 来 实现 Nios 总 线 协议 ) 相互 连接 着 。 我 们 将 注意 到 FPGA 芯 片上 的 总 
线 结构 不 是 使 用 三 态 驱动 器 实现 的 ， 如 同 第 7 章 中 描述 的 那样 。FPGA 是 一 个 通用 装置 ， 它 包含 
有 大 量 的 逻辑 单元 、 连 接线 路 和 开关 。 三 态 驱 动 器 仅 适合 于 用 作 特 定 的 用 途 ， 因 此 在 一 般 的 
FPGA 中 不 提供 。 使 用 多 路 复 用 电路 可 以 实现 三 态 总 线 的 功能 。 取 代 单 个 双向 路 径 ， 在 每 个 方向 
上 都 使 用 了 独立 的 多 路 复 用 器 。 尽 管 这 种 方法 需要 用 许多 门 ， 但 是 这 是 一 种 灵活 的 方案 ， 因 为 
所 需 的 逻辑 单元 和 互 连 的 资源 仅仅 是 FEPGA 总 资源 中 的 一 小 部 分 。 

处 理 器 和 接口 子 系统 占用 了 FPGA 芯 片 相对 小 的 一 部 分 ， 芯 片 的 其 余部 分 可 以 从 用 于 专门 应 
用 电路 的 实现 中 获得 。 这 些 电 路 可 以 直接 连 到 处 理 器 的 总 线 上 或 是 使 用 更 加 灵活 的 专用 1/O 端 口 
与 其 连接 。 在 一 个 片上 系统 环境 中 ， 处 理 器 子 系统 的 MO 端口 不 需要 连接 到 FPGA 设 备 的 MO 引 脚 
上 。 取 而 代 之 的 是 ， 设 计 者 可 以 用 它 去 连接 一 个 专用 的 应 用 电路 ， 该 电路 是 在 处 理 器 系统 中 用 
FPGA 实 现 的 。 | 

Nios 处 理 器 有 一 个 类 RISC 的 指令 集 。 它 的 运行 能 力 可 以 达到 50MIPS (每 秒 百 万 指令 数 )。 
设计 者 可 以 选择 在 同一 个 FPGA 上 实现 多 个 Nios 处 理 器 ， 这 样 可 实现 一 个 多 处 理 器 系统 。 

硬 处 理 器 核 

软 处 理 器 核 的 一 种 替代 方法 是 在 硅 片 上 实现 处 理 器 ， 这 样 可 构造 一 个 专用 的 FPGA。 
Excalibur 系 统 提供 基于 不 同 处 理 器 的 此 用 途 的 FPGA。 其 中 一 个 例子 是 在 其 中 一 部 分 实现 了 ARM 
处 理 器 核 的 FFGA。 除 了 处 理 器 电路 外 ，ARM 处 理 器 总 线 、RAM 模 块 及 UART 系 列 模块 也 在 硅 
片上 得 以 实现 。 这 样 可 以 实现 相对 高 性 能 的 系统 、 芯 片 的 其 余部 分 由 一 般 的 FPGA 资 源 构成 。 使 
用 硬 处 理 器 核 ， 系 统 的 运行 性 能 可 达 数 百 MIPS。 

设计 者 的 观点 

代入 式 系统 的 设计 者 肯定 要 寻找 最 简单 和 最 有 成 本 效益 的 技术 途径 。 微 控制 器 芯片 对 于 那 
些 必 须要 实现 一 个 完整 系统 的 需求 来 讲 可 能 是 一 种 最 好 的 选择 。 如 果 需 要 用 附加 芯片 的 方式 实 
现 系 统 ， 情 况 就 不 同 了 。 这 时 ，FPGA 解 决 方式 就 变 得 更 具 吸 引力 ， 因 为 它们 可 能 只 需要 较 少 的 
芯片 就 可 以 实现 这 个 系统 。 

另 一 个 要 考虑 的 内 容 是 预 设计 模块 的 可 用 性 。 一 个 微 控制 器 芯片 包含 了 许多 不 间 的 模块 ， 
任何 使 用 这 些 模块 不 能 实现 的 特性 ， 必 须 使 用 附加 芯片 来 实现 。 一 个 FPGA 设 备 允 许 设计 者 设计 
任何 类 型 的 数字 电路 。 许 多 实际 的 设计 中 包含 许多 执行 通用 任务 的 电路 ， 这 样 的 电路 应 该 能 从 
模块 库 中 获得 。 使 用 IO 接口 和 定时 器 电路 的 情况 就 是 一 个 典型 的 例子 。 如 果 其 他 的 有 用 模块 可 
用 ， 那 就 非常 方便 了 。 对 于 信号 处 理 的 应 用 ， 库 中 应 包含 有 专用 的 过 让 器 电路 和 快速 乘法 器 。 
如 果 设 计 的 系统 需要 通过 一 个 标准 总 线 (如 PCI) 连接 到 其 他 的 计算 机 上 ， 那 么 如 果 PCI 接 口 可 
以 作为 一 个 预 设计 模块 得 到 ,设计 者 的 任务 是 非常 简单 的 。 


9.10 结束 语 

这 一 章 以 一 个 简单 的 应 用 介绍 了 一 个 完整 的 代 人 式 计 算 机 系统 设计 过 程 。 我 们 没有 使 用 特 
殊 的 微 控 制 器 ， 因 为 其 中 包含 的 原则 是 一 致 的 。 它们 是 嵌 人 式 系统 设计 者 要 面 对 的 核心 问题 。 

理解 硬件 和 软件 间 密 切 的 相互 作用 是 非常 重要 的 。 设计 可 能 包括 对 轮 询 WO 和 中 断 的 权衡 、 
不 同 的 指令 集 在 功能 和 代码 压缩 间 的 权衡 、 功 耗 和 性 能 间 的 权衡 ， 等 等 。 

已 经 非常 庞大 并 仍 在 迅速 扩展 的 做人 式 应 用 领域 为 计算 机 技术 的 创造 性 应 用 提供 了 巨大 的 
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在 9.3 节 中 给 出 的 微 控 制 器 接收 十 进 制 数 (0 到 9)， 将 它们 换 成 ASCII 编 码 字符 送 到 串 行 口上 。 
每 当 一 个 数字 到 达 时 ， 它 必须 被 显示 在 连接 到 并 行 端口 A 上 的 七 段 显示 器 上 。 给 出 连接 中 所 
需要 完成 的 功能 。 显 示 器 的 段 标志 如 图 A-33 所 示 。 写 一 段 C 语 言 程 序 执行 要 求 的 任务 。 用 轮 
询 法 检测 每 个 ASCII 码 字符 是 否 到 达 。 

写 一 段 汇 编 语言 程序 实现 9.1 中 的 任务 。 

使 用 中 断 方式 检测 每 个 ASCII 码 字符 是 否 到 达 来 解决 9.1 中 的 问题 。 

针对 9.3 中 的 问题 写 一 7 段 汇编 语言 程序 。 

9.3 节 中 的 微 控 制 器 在 它 的 串 行 口上 接收 十 进 制 数 。 每 个 数字 由 两 个 ASCII 码 字符 的 数字 编 
码 组 成 ,为 了 区 分 连续 的 两 位 数字 数 ， 使 用 H 作 为 定 界 符 。 这 样 如 果 两 个 连续 的 数字 是 43 和 
28， 接 收 的 序列 将 是 H43H28。 每 个 数字 将 被 显示 在 连接 到 端口 A 和 B 上 的 两 个 七 段 显 示 器 
上 。 定 界 符 不 应 该 被 显示 出 来 。 只 有 当下 一 轮 接收 到 两 个 数字 时 显示 的 内 容 才 会 被 改变 。 
给 出 这 种 连接 所 要 完成 的 功能 。 显 示 器 的 段 标志 如 图 A-33 所 示 。 写 一 段 C 语 言 程序 执行 所 需 
完成 的 任务 。 使 用 轮 询 方式 检测 每 个 ASCH 码 字符 是 否 到 达 。 

写 一 段 汇编 语言 程序 实现 9.6 中 的 任务 。 

使 用 中 断 方式 检测 每 个 ASCI 码 字符 是 否 到 达 来 解决 9.5 中 的 问题 。 

针对 9.7 中 的 问题 写 一 段 汇 编 语言 程序 。 

在 9.3 节 中 微 控制 器 使 用 它 的 申 行 口 接收 十 进 制 数 ， 每 个 数字 由 四 个 ASCII 码 字符 的 数字 编 
码 组 成 ， 为 了 区 分 连续 的 四 位 数字 数 ， 使 用 于 作为 定 界 符 。 这 样 如 果 两 个 连续 的 数字 是 
2143 和 6292， 接 收 的 序列 将 是 H2143H6292。 每 个 数字 将 被 显示 到 四 个 七 段 显示 器 上 。 假 设 
SAARELA TBO 七 段 译 码 器 电路 与 其 相连 ， 如 图 P9-1 所 示 。 给 出 到 微 控 制 器 的 
必要 连接 ， 写 一 段 C 语 言 程序 执行 需要 完成 的 任务 ， 并 使 用 轮 询 方式 检测 每 个 ASCII 码 字符 
是 否 到 达 。 


BCD 数 字 





图 P9-1 使 用 BCD 译 码 器 的 七 段 显 示 器 


写 一 段 汇编 语言 程序 实现 9.9 中 的 任务 。 

在 解决 9.9 中 的 问题 时 ， 使 用 中 断 方式 检测 每 个 ASCH 字 符 是 否 到 达 。 

写 一 段 汇编 语言 程序 实现 9.11 中 的 任务 。 

重复 9.9 题 ,但 假定 每 个 七 段 显 示 器 有 一 个 7 位 寄存 器 与 其 相连 ， 而 不 是 BCD- 七 段 译 码 器 。 
该 寄存 器 有 一 个 控制 输入 端 Load， 当 Load=1 时 ，7 个 数据 位 被 装 入 到 寄存 器 中 。 寄 存 器 中 
的 每 一 位 可 以 驱动 相连 显示 器 的 一 个 段 。 图 P9-2 给 出 了 寄存 器 显示 器 方案 。 微 控制 器 的 输 
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出 连接 在 并 行 端口 A 上 ， 该 端口 为 所 有 的 四 位 显示 器 提供 数据 。 





图 P9-2 使 用 一 个 寄存 器 的 七 段 显示 器 


重复 9.13 中 的 问题 ， 使 用 汇编 语言 编写 程序 。 

解决 9.13 中 的 问题 ， 使 用 中 断 方式 检测 每 个 ASCI 码 字符 是 否 到 达 。 

写 一 段 汇编 语言 程序 实现 9.15 中 的 任务 。 

在 9.5 节 中 我 们 假定 源 设备 在 脉冲 串 中 最 多 产生 80 个 字符 。 当 允许 产生 字符 多 于 80 个 字符 时 ， 
图 9-17 和 图 9-18 中 的 程序 是 否 还 合适 ?如 果 不 行 ， 给 出 对 该 程序 的 修改 程序 。 

在 图 9-17 的 程序 中 ， 确 定 哪个 环形 缓冲 区 为 空 的 测试 方法 是 检查 fin 和 fout 的 变 址 值 是 否 相 
等 。 可 以 引入 一 个 计数 器 变量 M 来 替代 这 种 检测 方式 ，M 表 示 缓 冲 区 中 当前 的 字符 数 。 使 
用 这 种 方式 修改 该 程序 。 

对 于 图 9-18 中 的 程序 重复 9.18 中 的 问题 。 

修改 9.6 节 中 的 反应 计时 器 ， 假 定 被 测试 人 总 是 在 一 秒 之 内 做 出 了 反应 。 这 样 经 历 的 时 间 应 
该 用 两 位 数字 显示 ，、 其 表示 一 秒 的 百 分 之 一。 将 两 个 七 段 显示 器 连接 到 端口 A 上 上 并且. 修改 
图 9-20 和 图 9-21 中 的 程序 ， 实 现 所 需要 的 操作 。 

在 图 9-19 中 ， 每 个 数据 的 七 段 显示 器 都 包含 着 一 个 BCD- 七 段 译 码 器 ; 因此 微 控制 器 对 每 
个 将 要 被 显示 的 数字 同时 要 提供 一 个 4 位 BCD 码 。 假 设 将 它 用 译 码 器 代 赫 ， 每 个 七 段 单元 
有 一 个 含有 控制 输入 Load 的 7 位 寄存 器 ， 当 Load = 1 时 ， 这 7 个 数据 位 被 装 入 到 寄存 器 中 。 
寄存 器 中 的 每 一 位 驱动 连接 到 显示 器 上 的 一 个 段 上 。 图 P9-2 给 出 了 寄存 器 显示 器 方案 。 扩 
展 图 9-20 和 图 9-21 中 的 程序 使 其 能 够 适用 于 这 个 寄存 器 显示 器 电路 。 

在 图 9-21 中 ， 一 个 按照 百 分 之 一 秒表 示 反 应 时 间 的 二 进 制 数 ， 使 用 被 100 和 10 连 除 的 方法 
转换 成 等 量 的 BCD 数 字 。 实 现 这 种 转换 的 另 一 种 方法 是 被 10 连 除 ， 在 这 种 情况 下 ， 每 次 除 
的 余数 是 一 个 所 需 的 BCD 数 。 用 这 种 方法 产生 的 数字 顺序 是 怎样 的 ? 修改 图 9-21 中 的 程序 ， 
执行 这 种 转换 。 

在 9.3 节 中 用 微 控制 器 生成 了 一 个 “日 计时 ”时 钟 。 这 个 时 间 (小 时 和 分 钟 ) 被 显示 到 四 个 
七 段 显示 器 上 。 假 定 每 个 显示 器 有 一 个 BCD- 七 段 译 码 器 与 其 相连 ， 如 图 P9-1 所 示 。 同 时 
假设 使 用 一 个 100MHz 的 时 钟 。 给 出 需要 的 硬件 连接 并 写 出 相应 的 程序 。 
重复 9.20 中 的 问题 ,但 假定 每 个 七 段 显 示 器 有 一 个 寄存 器 与 其 相连 ， 如 同 图 P9-2 中 所 示 的 
那样 。 

在 一 个 用 单 芯片 实现 的 系统 中 、 处 理 器 和 主 存储 器 驻 留 在 同一 个 芯片 。 在 这 个 系统 中 是 否 
需要 高 速 缓 存 ? 请 解释 。 
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第 10 章 
计算 机 外 围 设备 


本 章 目标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

“计算 机 输入 和 输出 设备 是 如 何 工作 的 

* 扫描 仪 和 打印 机 的 操作 

* 图形 卡 和 图 形 图 像 处 理 
“同步 和 异步 串 行 数据 连接 

“使 用 ADSL 和 电缆 调制 解 调 器 的 高 速 internet 连 接 


在 前 面 的 章节 中 我 们 讲述 了 处 理 器 、 存 储 器 、 磁 盘 和 只 读 光盘 存储 器 (CD ROM) 的 硬件 
和 软件 特性 ， 还 讲述 了 计算 机 与 外 部 设备 进行 通信 的 方法 ， 包 括 支持 程序 控制 输入 输出 、 中 断 
和 直接 存储 器 访问 的 硬件 和 软件 。 本 章 主 要 介绍 一 些 常用 的 计算 机 外 围 设备 以 及 它们 在 计算 机 
系统 中 的 连接 。 

外 图 设备 是 指 与 计算 机 相连 的 任何 外 部 设备 。 这 里 所 说 的 计算 机 只 包括 处 理 器 和 它 的 存储 
器 。 按 功能 划分 ， 计 算 机 外 围 设备 可 分 为 两 大 类 。 第 一 大 类 包括 执行 输入 输出 操作 的 设备 ， 如 
键盘 、 鼠 标 、 跟 踪 球 、 打 印 机 和 视频 显示 器 等 。 第 二 大 类 包括 主要 用 于 数据 辅助 存储 的 设备 ， 
主 存储 由 计算 机 主 存储 器 提供 。 一 些 大 容量 的 存储 设备 ， 尤 其 是 磁盘 ， 被 用 作 数 据 的 在 线 存 储 。 
其 他 的 ， 如 光盘 、 软 盘 和 磁带 ， 这 些 存储 介质 可 以 与 驱动 部 件 分 开 ， 从 而 可 以 将 数据 从 一 个 计 
算 机 系统 传输 到 另 一 个 计算 机 系统 。 例 如 光盘 是 发 布 软件 最 常用 的 存储 介质 ， 也 被 称 为 只 读 光 
盘存 储 器 (CD ROM)。 辅 助 存储 设备 在 第 5 章 已 经 讨论 过 。 

当今 ， 最 重要 的 计算 机 外 围 设备 是 那些 提供 与 mternet 连 接 的 设备 。 近 些 年 ， 计 算 机 领域 飞 
速 痢 长 都 是 计算 机 与 通信 相 结合 以 及 大 量 新 技术 应 用 于 网 络 的 结果 。 这 些 发 展 涉及 到 我 们 生活 
的 每 一 方面 ， 从 商业 到 娱乐 、 教 育 。 

在 这 一 章 ， 我们 将 概括 介绍 现代 计算 机 系统 输入 输出 设备 的 种 类 ， 并 简要 描述 其 中 包含 的 
技术 。 机 箱 以 外 的 设备 常常 是 使 用 申 行 方式 与 处 理 器 相连 ， 可 以 是 有 线 的 或 无 线 的 。 本 章 会 介 
绍 一 些 申 行 通信 的 基本 概念 。 


10.1 输入 设备 


输入 设备 包括 键盘 和 用 来 移动 屏幕 光标 的 设备 ， 如 鼠标 、 跟 踪 球 以 及 操纵 杆 等。 扫描 仪 和 
数字 照相 机 也 广泛 用 来 获取 图 像 ， 然 后 以 数字 化 形式 输入 计算 机 。 
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10.1.1 键盘 


最 常 遇 到 的 输入 设备 是 键盘 ， 通 常 附带 有 鼠标 和 跟踪 球 ， 与 输出 设备 视频 显示 器 一 起 用 来 
进行 直接 的 人 机 对 话 。 

键盘 有 两 种 类 型 。 一 种 是 由 安装 在 印刷 电路 板 上 的 机 械 开关 阵列 组 成 的 。 这 些 开关 按 行 列 
组 织 并 与 电路 板 上 的 微 控制 器 连接 。 当 一 个 开关 被 按 下 了 时， 控制 器 识别 出 它 的 行列 位 置 确定 是 
哪个 键 被 按 下 了 。 确 认 反 弹 后 (参见 第 4 章 )， 控 制 器 就 产生 该 键 的 代码 并 通过 趾 行 连接 发 送 给 
计算 机 。 

另 一 种 键盘 使 用 三 层 平板 结构 。 顶 层 是 塑料 材质 、 表 面 上 标记 着 键 的 位 置 ， 下 侧 安 装 有 导 
线 。 中 间 层 是 用 橡胶 制 成 的 ， 对 应 键 的 位 置 有 个 小 洞 。 底 层 是 金属 材料 ， 对 应 键 的 位 置 处 有 三 
块 。 当 在 顶层 的 键 位 置 上 施加 压力 时 ， 顶 层 下 侧 的 导线 与 底层 相应 的 凸 块 相 接触 ， 这 样 就 与 机 
械 开关 一 样 形成 一 个 电流 回路 ， 回 路 中 的 电流 将 被 微 控制 器 检测 到 。 采 用 这 种 结构 ， 我 们 可 以 
得 到 一 个 低 价 、 同 样 结实 耐用 并 可 防止 食物 与 饮料 污染 的 键盘 。 在 销售 终端 的 应 用 中 常常 可 以 
见 到 这 种 类 型 的 键盘 。 


10.1.2 MF 


1968 年 鼠标 的 发 明 是 人 机 对 话 发 展 的 一 个 重要 阶段 。 在 那 以 前 ， 文 本 是 主要 的 数据 输入 形 
式 。 鼠 标 使 得 通过 绘制 想 要 的 对 象 来 直接 输入 图 形 信息 ， 并 引入 了 许多 新 的 、 有 效 的 概念 ， 包 
括 窗 口 和 下 拉 菜 单 。 

鼠标 的 形状 非常 符合 操作 者 的 手 形 ， 这 样 在 一 个 平整 的 表面 上 可 以 随便 地 移动 它 。 一 个 电 
路 将 检测 到 该 移动 信息 ， 并 将 X 和 7 方向 移动 距离 的 测量 值 发 送 给 计算 机 。 移 动 检测 既 可 以 是 机 
械 的 也 可 以 是 光学 的 。 机械 式 鼠 标 安装 有 一 个 小 球 ， 小 球 随 鼠标 自由 滚动 。 通 过 检测 小 球 的 滚 
动 来 驱动 两 个 计数 器 计数 ， 每 个 计数 器 对 应 一 个 方向 的 移动 。 鼠 标 还 安装 有 2 到 3 个 按钮 。 微 控 
制 器 收集 计数 器 和 按钮 信息 、 然 后 编码 成 一 个 3 个 字 节 的 数据 包 通 过 串 行 连接 发 送 给 计算 机 。 

光学 鼠标 使 用 一 个 发 光 二 极 管 来 照射 放置 鼠标 的 表面 ， 用 一 个 光敏 元 件 检测 从 表面 反射 回 
来 的 光 。 有 一 些 类 型 的 光学 鼠标 必须 在 专用 的 垫子 上 滑动 ， 这 种 垫子 上 有 许多 水 平和 垂直 线条 
组 成 的 图 案 。 反 射 光 随 着 鼠标 在 平面 上 明暗 区 域 上 的 移动 而 变化 ， 通 过 计算 这 些 变 化 测定 鼠标 
移动 的 距离 。 | 

智能 鼠标 是 一 种 很 复杂 的 鼠标 ， 于 1999 年 由 Microsoft 公 司 推出 。 它 几乎 可 以 在 任何 表面 上 
使 用 。 取 代 简 单 的 光 传 感 器 ， 鼠 标 下 的 平面 的 一 个 小 区 域 图 像 被 采集 到 一 个 微小 的 数字 照相 机 
中 ， 将 图 像 信息 数字 化 。 该 数字 照相 机 每 秒 钟 可 以 采集 1500 张 图 片 。 除 非 表面 是 完全 一 致 和 光 
滑 的 ， 比 如 镜子 ， 否 则 它 的 图 像 就 会 有 线条 、 明 上 暗 变化 等 特征 。 通 过 比较 这 些 连续 的 图 像 ， 忌 
标 内 置 处 理 器 就 可 以 相当 精确 地 测量 出 移动 的 距离 。 读 处 理 器 采用 关联 信号 处 理 技术 来 确定 从 
一 个 图 片 到 另 一 个 图 片 的 位 移 。 这 是 一 项 计算 密集 型 任务 ， 每 秒 钟 必须 要 重复 计算 1500 次 ， 所 
以 必须 有 功能 强大 并 且 廉 价 的 嵌入 式 处 理 器 才 可 行 。 这 种 处 理 器 每 秒 钟 能 执行 1800 万 条 指令 。 

自从 筷 标 被 发 明 后 ， 又 开发 出 了 许多 具有 相同 功能 的 设备 ， 如 跟踪 球 、 操 作 杆 和 触摸 垫 。 


10.1.3 跟踪 球 、 操 作 杆 和 触摸 把 
鼠标 可 以 使 操作 者 能 够 移动 屏幕 上 的 光标 。 为 了 适应 各 种 各 样 的 应 用 环境 和 使 用 者 的 爱好 ， 
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又 开发 出 了 大 量具 有 相似 功能 的 新 型 输入 设备 。 

跟踪 球 的 工作 原理 与 机 械 式 鼠标 十 分 相似 。 将 一 个 小 球 安装 在 键盘 上 ， 使 用 者 通过 滚动 小 
. 球 来 控制 屏 莫 上 光标 移动 。 

操作 杆 是 一 根 装 有 枢 轴 的 短 杆 ， 用 手 可 以 将 它 在 X-Y 平 面 上 进行 任何 移动 。 当 这 一 移动 信息 
发 送 到 计算 机 后 ， 相 应 的 软件 就 将 屏幕 上 的 光标 沿 相同 方向 移动 。 

操作 杆 的 位 置 可 以 被 合适 的 线形 或 角形 位 置 传感器 检测 到 ， 如 图 10-1 所 示 的 电压 计 装 置 。 
电压 计 X 和 7 的 电压 输出 分 别 输入 到 两 个 模 / 数 (AD) 转换 器 上 ， 转 换 器 的 输出 决定 操作 杆 的 位 
置 ， 从 而 决定 移动 的 预期 方向 。 


操作 杆 


一 





I 


图 10-1 操作 杆 ， 采 用 电压 计 作 为 位 置 传感器 


操作 杆 常 应 用 于 笔记 本 电脑 和 视频 游戏 上 。 应 用 于 笔记 本 电脑 时 ， 操 作 杆 安装 在 键盘 上 的 
按键 之 间 并 稍 高 于 按键 。 由 于 它 的 安装 位 置 ， 操 作 杆 具 有 不 需要 操作 者 将 手 移 开 键 盘 就 可 以 进 
行 操作 的 优点 ， 用 一 个 手指 轻 推 它 就 可 以 定位 屏幕 上 的 鼠标 。 操 作 杆 非常 结实 耐用 且 占 用 空间 
小 。 为 了 用 在 视频 游戏 中 ， 操 作 村 被 设计 成 一 种 符合 游戏 本 身 特性 的 手柄 ， 并 常常 装配 有 按钮 
控制 用 于 发 射 一 个 球 或 开 枪 。 ，. 

另外 一 种 非常 有 用 的 输入 设备 是 触摸 垫 ， 以 及 和 它 类 似 的 设备 一 触摸屏。 触摸 垫 是 用 压 
力 敏感 材料 制 成 的 小 垫 。 当 使 用 者 的 手指 或 笔尖 触及 到 垫子 上 的 某 一 点 时 ， 压 力 使 该 点 的 电 性 
质 发 生变 化 ， 这 样 该 点 的 位 置 就 被 检测 出 并 传送 给 计算 机 。 只 需 在 垫子 上 移动 手指 ， 使 用 者 就 
可 以 指示 软件 在 相同 方向 上 移动 屏幕 上 的 光标 。 这 就 使 得 触摸 垫 可 以 成 为 鼠标 或 操作 杆 的 低 价 
取代 设备 ， 并 且 由 于 它 没有 任何 移动 部 件 ， 所 以 非常 结实 耐用 ， 并 具有 高 可 靠 性 。 触 摸 热 非常 
适用 于 便携 式 计算 机 。 

许多 新 型 材料 已 经 被 开发 出 来 制作 触摸 垫 。 其 中 最 具有 创新 意义 的 可 能 是 个 入 了 大 量 微小 
光纤 维 的 材料 。 这 种 材料 不 仅 能 够 识别 与 它 相 接触 的 物体 的 位 置 ， 而 且 也 能 识别 施加 压力 的 大 
小 。 这 种 材料 主要 是 为 太空 机 器 人 应 用 而 开发 的 ， 但 很 快 就 发 现 了 其 他 应 用 ， 如 作为 一 种 输入 
设备 取代 并 扩充 钢琴 键 。 

触摸 垫 与 液晶 显示 器 结合 起 来 生产 出 一 种 触摸 屏 ， 既 可 以 用 作 输 入 又 可 以 用 作 输 出 。 这 种 
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屏幕 普遍 用 于 个 人 数字 助理 (PDA) 中 ， 比 如 Palm Pilot。 另 外 ， 还 有 一 种 使 用 阴极 射线 管 的 触 
找 屏 ， 手 指 触摸 这 种 屏幕 引起 的 电容 变化 在 电子 束 扫描 屏幕 显示 图 像 时 被 检测 到 。 触 模 屏 常常 
用 于 收银 机 和 销售 终端 点 上 。 


10.1.4 扫描 仪 


扫描 仪 是 将 印刷 材料 和 照片 转换 成 数字 信息 的 设备 。 早 期 的 扫描 仪 其 扫描 页 被 安装 在 线 着 
传感器 转动 的 滚筒 上。 今天 的 扫描 仪 大 都 是 平面 结构 ， 扫 描 页 铺 放 在 平坦 的 玻璃 表面 上 。 光 源 
扫 过 页 面 ， 反 射 光 被 豪 集 到 电荷 不合 器 〔CCD ) 的 线性 阵列 上 。 当 电荷 类 合 器 件 感光 时 ， 一 个 
电荷 就 被 储存 到 与 之 相连 的 微小 电容 器 中 ， 这 样 电 荷 量 就 和 光 强 成 比例 。 这 些 电荷 将 被 适当 的 
电路 收集 起 来 ， 并 通过 一 个 模 / 数 转换 器 转换 成 数字 形式 。 对 于 彩色 扫描 仪 ， 红 色 、 绿 色 和 蓝 色 
滤 光 器 用 来 分 离 三 种 基本 色 ， 然 后 分 别 进行 处 理 。 当 光源 扫 过 页 面 时 ， 传 感 器 阵列 重复 读 取 ， 
从 而 取样 出 图 像 的 连续 像素 线 。 需 要 指出 的 是 这 种 技术 也 用 于 数字 复印 机 ， 数 字 复印 机 实际 上 
就 是 扫描 仪 和 激光 打印 机 的 结合 产物 。 

将 一 张 印刷 页 扫描 到 计算 机 后 ， 图 像 在 存储 器 中 以 像素 阵列 的 形式 表示 出 来 。 最 简单 的 情 
况 下 ， 一 个 像素 用 一 位 表示 ， 来 显示 图 像 中 相应 点 是 明 还 是 瞳 。 对 于 更 高 品质 的 图 像 ， 每 个 像 
素 需要 存储 更 多 的 信息 来 表示 相应 点 的 颜色 和 光 强 。 每 个 像素 可 以 使 用 长 达 3 个 字 节 的 信息 ， 分 
别 对 应 三 种 原色 中 的 一 种 。 

考虑 一 页 文本 的 例子 ， 图像 中 的 黑暗 区 域 对 应 于 印刷 的 字符 。 许 多 字符 识别 技术 已 经 被 开 
发 出 来 ， 可 以 通过 分 析 存 储 在 存储 器 中 的 像素 图 来 识别 图 像 中 的 字符 。 因 此 ， 就 可 以 创建 一 个 
描述 印刷 页 内 容 的 文本 文件 ， 在 这 个 文件 中 每 个 字符 被 转换 成 适当 的 二 进 制 代码 ， 如 ASCE 码 。 
这 样 结果 文件 就 可 以 被 文本 处 理 程序 如 Word 处 理 了 。 


10.2 输出 设备 


计算 机 输出 可 以 采取 各 种 各 样 的 形式 ， 包 括 字 符 文本 、 图 形 图 像 和 声音 等 。 下 面 我 们 讲述 
一 些 常 用 的 输出 设备 。 


10.2.1 视频 显示 器 


在 任何 需要 可 视 化 显示 计算 机 输出 的 时 候 ， 都 要 用 到 视频 显示 器 。 其 中 最 常用 的 是 使 用 阴 
极 射线 管 (CRT) 显示 器 。 

首先 讲述 一 下 如 何在 阴极 射线 管 显示 器 上 形成 图 像 。 聚 焦 后 的 电子 束 擅 击 到 荧光 屏 上 后 引 
起 发 光 ， 在 黑暗 背景 衬托 下 看 起 来 就 像 一 个 亮点 。 当 电子 束 烽 灭 或 转移 到 其 他 点 时 ， 这 个 亮点 
就 消失 了 。 因 此 ， 一 般 来 说 ， 有 三 个 独立 的 变量 随时 都 需要 指定 值 ， 来 表示 电子 束 的 位 置 和 强 
E. 电子 束 的 位 置 指 的 是 屏幕 上 点 的 Y 和 7 坐标 。 电 子 束 的 强度 ， 通 常 称 为 Z 轴 控制 ， 提 供 该 点 的 
友 度 和 亮度 信息 。 屏 幕 上 可 寻 址 的 最 小 区 域 称 为 像素 ， 它 由 许多 大 小 不 同 的 小 点 按照 某 些 几 何 
图 形 排列 而 成 。 按 不 同 的 组 合 方式 照 亮 这 些 点 可 以 得 到 不 同 级 别 的 亮度 。 这 种 技术 称 为 半 色 调 。 
在 彩色 显示 器 中 ， 每 个 像素 有 三 种 不 同 颜色 的 荧光 点 : 红色 、 绿 色 和 蓝 色 : 按 不 同 的 组 合 方式 
照 亮 这 些 点 可 以 得 到 不 同 的 颜色 。 f 

电子 束 在 屏幕 上 形成 的 点 的 大 小 决定 图 像 中 总 像素 的 多 少 。 沿 X 或 ? 轴 通 常 都 有 700-~2500 个 
像素 。2 轴 信息 可 以 在 24 位 内 进行 描述 ， 每 个 字 节 对 应 于 一 种 颜色 。 它 能 够 产生 用 人 眼 所 能 观察 





到 的 最 高 色彩 分 辨 率 。 计 算 机 视频 显示 器 的 最 通用 标准 是 VGA (视频 图 形 阵列 ) 以 及 它 的 高 品 
质 升 级 版 本 。 基 本 的 VGA 显 示 器 有 640 x 480 个 像素 。 升 级 标准 规定 显示 器 有 更 高 的 分 辩 率 ， 如 
1024 x 768 (XVGA) 和 1600 x 1200 (UXGA). 

采用 光 梓 扫描 技术 ， 字 符 文本 和 图 片 都 可 以 被 显示 出 来 。 电 子 束 连续 地 从 左 到 右 扫 描 每 一 
行 像素 ， 从 上 到 下 ， 直 到 扫描 完 屏幕 上 所 有 行 。 许 多 显示 器 都 采用 隔行 扫描 以 提高 观察 到 的 
屏幕 刷新 速率 。 在 这 种 扫描 方式 中 ， 电 子 束 扫 描 屏 幕 两 遍 ， 一 遍 扫 描 奇 数 行 ， 另 一 遍 扫 描 侦 
数 行 。 将 要 显示 的 图 像 被 存储 在 一 个 显示 组 冲 区 中 ， 这 个 缓冲 区 在 扫描 期 间 提供 Z 轴 信息 。 在 
最 简单 的 表示 方式 中 ， 用 一 个 位 图 来 描述 屏幕 上 将 要 显示 的 图 像 ， 位 图 中 每 一 位 对 应 一 个 像 
Re 因此， 一 个 有 1024 x 1024 个 像素 的 屏幕 就 需要 1Mb 的 显示 缓冲 存储 空间 。 为 了 能 以 60 次 / 
秒 的 速率 刷新 显示 器 ， 数 据 传输 速率 要 达到 60Mb/s 。 今 天 的 高 品质 显示 器 每 个 像素 要 使 用 32 
位 ， 因 此 需要 的 显示 缓冲 空间 和 通信 带宽 就 更 大 。 通 常 ， 在 32 位 中 只 有 24 位 用 来 存储 色彩 信 
息 ， 第 4 个 字 节 主 要 用 来 与 主 处 理 器 的 字 长 相 兼 容 ， 同 时 也 为 日 后 的 升级 提供 空间 。 现 代 的 计 
算 机 系统 能 够 在 屏幕 上 重 倒 多 幅 不 同 的 图 像 (如 在 基于 窗口 的 操作 系统 中 )， 因 此 就 需要 几 个 
独立 的 显示 缓冲 区 。 


10.2.2 平面 显示 器 


在 计算 机 显示 应 用 中 ， 虽 然 阴极 射线 管 技术 占 主导 地 位 ， 但 平面 显示 器 却 越 来 越 来 流行 。 
平面 显示 器 更 薄 更 轻 ， 能 提供 更 好 的 线性 ， 在 某 些 情况 下 甚至 有 更 高 的 分 辨 率 。 多 种 类 型 的 平 
面 显示 器 已 经 被 开发 出 来 了 ， 包 括 液晶 显示 器 、 等 离子 显示 器 和 场 致 发 光板 显示 器 。 低 价 平面 
显示 器 的 出 现 十 分 有 助 于 笔记 本 电脑 的 发 展 。 

液晶 显示 器 是 由 一 薄 层 液晶 一 一 种 具有 水 晶 性 质 的 液体 一 - 夹 在 两 块 透明 板 之 间 构 成 的 。 
顶板 上 安装 有 透明 的 电极 底板 是 一 面 镜子 。 通 过 施加 适当 的 电信 号 来 穿 过 两 块 板 ， 将 液晶 的 
不 同 部 位 激活 ， 从 而 改变 这 些 部 位 的 光 散 射 性 和 极 性 发 生变 化 。 因 此 这 些 部 分 既 可 能 传导 光线 
也 可 能 阻 断 光线 。 通 过 液晶 中 选 定 部 分 的 光线 形成 一 幅 图 像 ， 然 后 镜子 将 其 反射 回来 给 观察 者 。 
液晶 显示 器 常 应 用 于 手表 、 计 算 器 、 笔 记 本 电脑 以 及 其 他 设备 中 。 

液晶 显示 器 有 两 种 类 型 。 静 态 显示 器 的 结构 比较 简单 ， 它 里 面 的 电极 分 别 治 着 顶板 中 的 一 
个 轴 和 底板 中 与 该 轴 垂直 的 轴 安装 ， 这 样 就 定义 了 列 和 行 。 要 照 亮 某 一 特定 部 分 ， 需 要 在 一 个 
行 电极 和 一 个 列 电极 之 间 施 加 一 个 电压 。 这 个 电压 产生 一 个 带电 区 域 使 两 个 电极 交点 处 的 液晶 
区 域 被 点 亮 ， 显 示 出 一 个 亮点 。 这 种 结构 的 显示 器 制造 容易 且 价 格 便宜 ， 但 图 像 质 量 较 低 。 由 
于 照 亮 的 区 域 没有 很 好 地 被 界定 ， 因 此 图 形 的 边界 也 不 是 很 清晰 。 同 时 ， 由 于 长 电极 的 电容 很 
大 ， 点 亮 和 炮 灭 的 速度 就 比较 慢 。 例 如 ， 当 鼠标 在 屏 医 上 快速 移动 时 ， 迟 缓 的 反应 就 会 使 展 标 
后 面 拖 有 一 个 尾巴 。 

通过 在 每 一 交点 处 引入 一 个 晶体 管 可 以 得 到 更 高 品质 的 显示 器 ， 这 种 显示 器 反应 速度 快 ， 
并 且 能 够 更 好 地 控制 需要 被 照 亮 的 区 域 。 唱 体 管 安装 在 一 块 薄膜 中 ， 这 块 薄膜 安装 在 其 中 的 一 
个 板 中 ， 因 此 这 种 类 型 的 显示 器 称 为 薄膜 晶体 管 显示 器 (TFT)， 也 称 为 有 源 答 阵 显示 器 ， 常 用 
于 高 档 笔 记 本 电脑 中 。 

等 离子 显示 器 是 由 两 块 玻璃 板 组 成 ， 玻 璃 板 之 间 被 一 薄野 充满 氛 气 之 类 的 气体 隔 开 。 每 块 
板 都 有 几 个 槛 穿 它 们 的 平行 电极 。 两 块 板 上 的 平行 电极 都 是 在 右 角 到 达 另 一 块 板 上 。 将 一 个 脉 
冲 电 压 施 加 到 属于 不 同 板 的 两 个 电极 之 间 ， 就 会 使 两 个 电极 相交 处 的 一 小 块 区 域 的 气体 发 光 。 
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并 且 由 于 有 持续 施加 在 所 有 电极 上 的 低 电压 ， 那 部 分 气体 将 持续 发 光 。 辣 时 还 有 一 个 相似 的 脉 
冲 装 置 用 来 选择 性 地 熄灭 亮点 。 等 离子 显示 器 能 够 提供 很 高 的 分 辨 率 ， 但 价格 昂贵 ， 通 常用 于 
那些 对 显示 质量 要 求 非常 高 ， 且 不 宜 使 用 大 体积 的 阴极 射线 管 的 场合 。 

场 致 发 光板 显示 器 在 两 块 电 导 板 之 间 加 入 一 薄 层 磷 ， 当 电信 号 到 电导 板 上 时 就 会 导致 磷 发 
光 而 形成 图 像 。 

平面 显示 器 在 各 种 应 用 中 的 生存 能 力 与 相 竞争 的 阴极 射线 管 显示 器 技术 的 发 展 有 着 密切 的 联 
系 ， 至 今 阴极 射线 管 技 术 仍然 能 够 将 性 能 和 价格 很 好 地 结合 起 来 ， 并 且 也 很 容易 实现 彩色 显示 。 


10.2.3 打印 机 


打印 机 是 用 于 硬 拷贝 输出 数据 或 文本 的 设备 。 通 常 分 为 击 打 式 和 非 击 打 式 两 种 类 型 ， 这 取 
决 于 使 用 的 打印 机 制 的 特性 。 击 打 式 打印 机 使 用 机 械 打 印 机 制 ， 非 击 打 式 打印 机 主要 依靠 光学 、 
晓 墨 或 静电 技术 。 

非 击 打 式 打印 机 只 有 很 少 的 移动 部 件 ， 因 而 能 够 高 速 运行 。 其 中 激光 打印 机 使 用 的 技术 与 
影印 机 相同 。 用 激光 束 扫描 覆盖 有 带 正 电荷 的 光敏 材料 的 转 鼓 ， 被 激光 束 照射 到 的 正 电荷 消失 ， 
然后 将 带 负电 荷 的 色 粉 喷洒 在 转 鼓 上 ， 这 些 粉 末 将 粘 附 在 正 电 荷 上 形成 一 页 影像 ， 紧 接着 转 印 
到 纸 面 上 。 转 印 完 后 将 转 鼓 上 多 余 的 色 粉 清洗 干净 以 备 打 印 下 一 页 。 

另 一 种 非 击 打 式 打印 机 是 采用 喷 墨 方式 的 ， 在 这 种 方式 中 不 同 颜色 的 墨 滴 从 细小 的 喷嘴 喷 
射 到 纸 页 ， 从 而 产生 彩色 输出 。 用 来 喷洒 墨 滴 的 技术 很 多 ， 例 如 ， 在 气泡 式 喷 黑 打印 机 中 ， 喷 
中 与 一 个 外 加 有 热 脉 冲 的 小 腔 相 连 。 热 脉冲 使 小 腔 里 的 墨水 蒸发 形成 气泡 而 将 少量 墨水 从 喷嘴 
挤 出 。 当 小 腔 里 的 气体 冷却 后 又 会 产生 真空 而 吸入 一 些 新 的 墨水 。 喷 墨 打印 机 通常 要 比 激光 打 
印 机 昂贵 ， 但 打印 出 的 图 像 质量 更 高 。 

大 多 数 打印 机 形成 字符 和 图 形 图 像 的 方式 与 在 视频 屏幕 上 形成 图 像 的 方式 相同 ， 即 在 矩阵 
上 打印 点 。 这 种 方式 很 容易 打印 出 各 种 字体 ， 也 可 打印 图 形 图 像 。 但 由 于 人 眼 对 规则 图 案 的 敏 
感性 ， 一 个 规则 的 点 阵 很 容易 被 观察 出 来 从 而 影响 图 像 的 视觉 效果 。 高 品质 的 打印 机 使 用 抖动 
技术 来 克服 这 个 缺点 。 回 想 一 下 ， 我 们 知道 每 个 像素 由 几 个 小 点 组 成 ， 每 个 小 点 的 颜色 为 三 原 
色 中 的 一 种 。 拌 动 技术 就 是 使 每 一 个 像素 中 组 成 点 的 几何 排列 和 颜色 不 断 变化 ， 这 样 就 打破 了 
规则 图 案 的 单一 性 ， 并 且 外 观 上 具有 更 多 的 色彩 。 

最 高 品质 的 打印 机 通常 用 于 图 形 艺术 品 和 照片 的 打印 。 采 用 染料 升华 技术 的 喷 墨 打印 机 就 
适合 这 些 应 用 。 但 它们 也 是 最 昂贵 的 。 在 这 种 打印 机 中 通过 控制 墨水 加 热 的 温度 来 改变 喷射 在 
纸 页 上 的 墨水 量 ， 因 此 每 个 点 的 颜色 深度 可 以 连续 改变 。 因 为 墨水 在 纸张 上 还 会 进行 扩散 ， 所 
以 还 需要 使 用 特殊 的 纸张 ， 以 得 到 颜色 的 精确 控制 。 


10.2.4 图 形 加 速 卡 


在 许多 计算 机 应 用 中 都 包括 高 品质 的 图 形 图 像 。 最 常见 的 图 形 使 用 是 在 视频 游戏 中 ， 其 他 
应 用 还 包括 艺术 作品 、 医 学 图 像 和 动画 电影 等 。 高 品质 的 图 像 需 要 大 量 的 显示 像素 。 在 一 个 图 
像 被 发 送 到 显示 屏幕 之 前 ， 必 须 计 算出 每 个 像素 的 颜色 来 并 存储 到 一 个 存储 缓冲 区 中 。 从 那里 ， 
这 些 信息 以 至 少 30 次 /s 的 速度 发 送 到 屏幕 以 保持 显示 图 像 被 刷新 。 

计算 像素 亮度 和 色彩 的 任务 可 以 由 软件 来 完成 ， 结 果 图 像 可 以 存储 在 计算 机 主 存 的 屏幕 组 
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冲 区 中 ， 从 那里 通过 计算 机 总 线 将 它 发 送 给 显示 器 。 然 而 ， 由 于 需要 处 理 的 数据 量 非 常 巨大 ， 
以 至 于 很 容易 就 将 处 理 器 淹没 ,而 只 剩 下 很 少 的 计算 能 力 给 其 他 任务 。 而 且 ， 使 用 计算 机 总 线 
传送 屏幕 缓冲 区 的 内 容 给 显示 器 也 会 消耗 相当 一 部 分 总 线 带宽 。 如 果 每 个 像素 使 用 32 位 ，-…… 个 
1024 x 1024 像 素 的 图 像 就 需要 用 4MB 的 数据 来 表示 ， 这 将 导致 存储 总 线 上 至 少 有 120MBAs 的 传 
输 量 。 

大 部 分 图 形 应 用 都 要 求 有 显示 三 维 (3D) 物体 功能 。 例 如 ， 在 计算 机 游戏 中 ， 完 全 用 软件 
创建 一 个 完美 视频 图 像 的 人 工 三 维 世 界 。 产 生 这 些 图 像 的 计算 密度 是 非常 高 的 ， 最 切实 可 行 的 
方法 是 提供 一 个 专门 设计 用 来 处 理 这 些 密集 计算 的 处 理 器 。 这 种 处 理 器 称 为 图 形 处 理 单元 
(GPU)， 是 安装 在 大 部 分 个 人 计算 机 上 很 流行 的 图 形 卡 的 基本 部 件 。 图 形 卡 还 有 一 个 大 容量 高 
速 存储 器 ， 一 般 在 8MB 到 64MB 的 范围 内 。 这 个 存储 器 在 GPU 进 行 计算 时 被 使 用 ， 同 时 它 也 存储 
将 被 传送 到 显示 屏幕 上 的 结果 图 像 。 图 形 卡 是 直接 与 显示 器 连接 的 ， 这 样 刷 新 屏幕 所 需 的 数据 
传输 就 不 需要 使 用 计算 机 总 线 了 。 高 性 能 的 图 形 卡 能 够 每 秒 钟 刷 新 屏幕 75 到 200 次 。 

图 形 端口 

图 形 卡 可 以 插入 到 计算 机 总 线 上 ， 比 如 PCI。 但 更 常见 的 情况 是 ， 在 计算 机 主板 上 有 一 个 称 
为 图 形 加 速 端口 (AGP) 的 特殊 连接 插 槽 图形 卡 插入 到 这 个 插 槽 里 。AGP 是 一 个 32 位 的 端口， 
它 能 够 支持 的 传输 速率 高 于 PCI 总 线 。 这 种 端口 有 AGP 1x、2x、4x 和 8x 几 种 标准 ， 其 中 AGP 1x 
是 最 初 的 标准 ,能 提供 264MB/s 的 数据 传输 速率 。 后 来 的 标准 能 够 支持 的 速率 是 这 个 速率 的 几 倍 ， 
其 中 AGP 8X 能 提供 2GB/s 的 速率 。 

图 形 处 理 

在 计算 机 图 形 中 ， 一 个 三 维 物体 是 通过 将 其 表面 分 割 成 大 量 的 小 多 边 形 (通常 是 三 角形 ) 
来 表示 的 。 在 这 个 过 程 中 ， 第 一 项 任务 是 将 三 维 场景 转换 成 二 维 表示 ， 这 个 二 维 表示 应 尽 可 
能 地 与 人 眼 观 察 到 的 图 像 相 一 致 。 首 先 通过 投影 和 透视 计算 确定 出 三 角形 的 顶点 在 一 维 图 像 
中 的 位 置 ， 这 些 三 角形 将 用 来 表示 场景 中 的 各 种 物体 。 然 后 ， 再 用 一 个 复杂 的 算法 给 每 一 个 
三 角形 确定 一 个 适当 的 颜色 和 阴影 ， 由 此 形成 一 幅 到 真 的 图 像 。 这 些 计算 需 要 考虑 场景 中 的 
光源 、 各 种 表面 的 反射 、 阴 影 等 因素 。 处 理 过 程 中 很 重要 的 一 步 是 给 表面 增加 一 些 纹理 ， 如 
木材 纹路 和 砖 墙 的 外 观 。 纹 理 通常 是 用 纹理 像素 制作 出 来 。 将 一 个 纹理 像素 阵列 施加 在 单个 
图 像 三 角形 上 就 可 以 产生 出 原始 三 维 物体 纹理 表面 的 效果 。 场 景 中 被 隐藏 了 的 部 分 在 剪 驾 过 
程 中 删除 掉 以 节约 不 必要 的 计算 。 处 理 的 最 后 一 步 是 取样 ， 在 这 一 步 中 图 像 被 取样 来 确定 每 
一 个 像素 的 颜色 和 亮度 。 将 整个 3D 场 景 分 解 为 对 像素 (这些 像 素 将 被 传送 给 显示 器 ) 的 描述 
的 过 程 称 为 泻 染 。 | 

为 了 移动 图 像 ， 这 些 计算 每 秒 钟 必 须 重复 很 多 次 。 要 产生 屏幕 上 平滑 运动 的 外 观 ， 图 像 的 
像素 每 秒 钟 至 少 需 要 重复 计算 20 次 ， 一 般 是 30 到 40 次 ， 以 得 到 高 品质 的 视频 图 ， 这 称 为 帧 频 。 
视频 卡 必要 的 计算 能 力 通常 是 用 T&L (转换 和 照明 ) 速率 来 衡量 ，T&L 是 指 每 秒 钟 的 三 角形 数 
量 ， 对 于 这 些 三 角形 图 形 卡 完成 了 投影 、 剪 辑 、 照 明和 取样 所 需 的 全 部 计算 。 

举 一 个 例子 ， 在 表 10-1 中 列 出 了 ATI 公 司 制造 的 RADEON VE 图 形 卡 的 特性 。nVidia 公司 制 
造 的 GeForce 2 MX 图 形 处 理 器 也 能 提供 十 分 相似 的 功能 。 这 两 种 图 形 卡 在 个 人 计算 机 中 都 非常 
流行 。 此 外 ， 还 有 一 些 性 能 更 高 的 专业 图 形 卡 。 在 这 个 计算 机 工业 中 飞速 发 展 的 领域 ， 功 能 更 
加 强大 的 处 理 器 不 久 就 会 出 现 。 
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表 10-1 RADEON VE 图 形 卡 


特 性 # £ 

GPU 芯片 RADEON VE 

总 线 AGP 4x 

存储 器 可 达 64MB,DDR SDRAM 

色彩 32 位 ， 其 中 8 位 保留 供 以 后 使 用 

像素 2048 x 1536 

T&L 速率 30M 个 三 角形 /s 

屏幕 刷新 频率 75 到 200， 图 像 分 辩 率 越 低 ， 刷 新 频率 越 高 

附加 功能 支持 TV、VCR、DVD、HDTV 和 压缩 的 MPEG2 
图 形 软件 


图 形 卡 提供 了 很 多 复杂 的 特性 ， 要 使 用 这 些 特性 需要 专门 为 图 形 卡 设计 软件 。 在 这 个 领域 
中 只 有 非常 少 的 标准 ， 市 场 是 完全 开放 的 。 仅 仅 在 计算 机 上 安装 了 一 个 更 好 的 图 形 卡 并 不 能 自 
动 地 改善 图 形 的 质量 ， 还 需要 有 专门 使 用 这 个 图 形 卡 的 软件 。 目 前 一 些 供 图 形 软件 使 用 的 应 用 
程序 接口 标准 (API) 已 经 开始 出 现 。 制 定 这 些 标准 的 目的 是 为 了 开发 出 独立 于 硬件 的 软件 。 以 
计算 机 游戏 软件 为 例 ， 有 了 这 些 标 准 它 就 可 以 在 不 同 公司 制造 的 图 形 卡 下 很 好 地 工作 ， 并 使 用 
每 一 个 图 形 卡 提供 的 特性 。OpenGL (开放 式 图 形 库 ) 就 是 这 种 标准 的 一 个 例子 。 逐 渐 地 ， 图 形 
卡 将 被 设计 成 和 OpenGL 以 及 其 他 涉及 图 形 处 理 的 相似 标准 相 兼容 。 


10.3 品行 通信 连接 


键盘 、 和 鼠标 等 设备 是 直接 与 计算 机 连接 起 来 的 ， 一 般 是 通过 串 行 通信 连接 。 其 他 设备 如 打 
印 机 和 扫描 仪 ， 既 可 以 直接 与 计算 机 连接 ， 又 可 以 通过 通信 网 络 与 计算 机 连接 ， 因 此 它们 可 以 
被 几 个 用 户 共 享 。 由 于 Internet 在 许多 计算 机 应 用 中 都 起 着 很 重要 的 作用 ， 所 以 计算 机 通常 是 永 
久 的 或 通过 拨号 连接 到 Intemet 上 。 

在 本 章 的 剩余 部 分 ， 我 们 主要 讲述 一 些 串 行 通 信 连 接 中 常用 的 方式 。 首 先 讲述 一 些 基本 概念 。 

调制 和 解 调 

在 数字 电路 中 ， 我 们 用 一 个 电信 号 表示 一 位 ， 该 电信 号 有 两 个 电压 值 。 如 果 在 通信 连接 时 
使 用 相同 的 表示 方法 ， 那 么 认为 该 连接 使 用 了 基带 。 在 另 一 种 可 供 选 择 的 方式 中 0 和 1 是 通过 调 
制 出 正弦 载波 信号 来 表示 的 ， 这 种 方式 也 被 广泛 使 用 并 称 为 宽带 传输 。 例 如 ， 信 号 频率 可 以 在 
两 个 不 同 值 之 间 变 换 , fi ERC 刻 表 示 1。 在 这 种 方式 下 ， 连 接 被 认为 使 用 了 调频 或 移 频 键 控 
(FSK). 此 外 , 还 使 用 了 很 多 其 他 的 调制 方式 , 如 可 以 改变 载波 信号 的 相位 产生 移 相 键 控 (PSK), 
或 改变 它 的 振幅 产生 调幅 (AM)。 正 交 调 幅 (QAM) 是 一 种 将 载波 信号 的 振幅 调制 和 相位 调制 
结合 起 来 的 方式 。 因 为 改变 了 两 个 参数 ， 所 以 这 种 方式 就 有 4 种 可 能 的 组 合 ， 因 此 每 个 传输 信号 
可 以 表示 2 位 信息 。 

在 任何 时 钟 周 期 下 传输 的 信号 形态 都 称 为 码 元 (symbol)。 因 此 ， 在 FSK 方 式 中 就 有 两 种 可 
能 的 码 元 ， 分 别 由 频率 为 和 所 的 正弦 信号 组 成 。 在 QAM 方式 中 有 四 种 可 能 的 码 元 ， 分 别 由 它 
们 的 振幅 和 相位 定义 。 波 特 闵 是 指 每 秒 钟 传输 的 码 元 的 数量 ， 即 每 秒 钟 信号 状态 改变 的 次 数 。 
只 有 在 二 元 调制 中 ， 如 FSK， 波 特 率 才 与 位 速率 相同 。 在 RAM 方式 中 ， 位 速率 是 波 特 率 的 两 倍 ， 
因为 每 一 码 元 表示 2 位 信息 。 还 有 一 些 调制 方式 使 用 了 8、16 或 更 多 种 码 元 。 如 在 一 个 有 16 种 码 
元 的 系统 中 ， 每 个 符号 表示 4 位 信息 ， 因 此 位 速率 是 波 特 率 的 4 倍 。 
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如 图 10-2 所 示 ， 在 通信 连接 的 两 端 安装 了 调制 解 调 器 进行 必要 的 信号 转换 。 图 中 显示 的 是 一 
台 连 接 到 网 络 服务 器 的 计算 机 ， 计 算 机 与 网 络 服务 器 之 间 连 接 可 以 是 永久 性 的 连接 ， 也 可 以 是 
使 用 电话 线 的 拨号 连接 。 


标准 接口 
' (RS-232-C ) 


/ 


通信 设备 

图 10-2 远程 连接 到 网 络 
同步 o 
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释 每 一 位 信息 。 当 通信 设备 彼此 对 对 方 物 理性 关闭 并 且 有 多 条 信和 号 线路 可 用 时 ， 时 钟 信 号 就 可 
以 与 数据 一 起 传送 过 去 。 然 而 ， 对 于 更 长 一 些 而 且 只 有 单条 信和 号 线路 可 用 的 连接 就 不 可 行 了 。 
更 重要 的 是 ， 即 使 有 第 二 条 线路 可 用 ， 数 据 信号 和 时 钟 信号 过 到 的 延迟 可 能 也 是 不 同 的 。 因 为 
这 些 原 因 ， 定 时 信息 与 数据 就 被 编码 在 同一 个 传输 通道 中 。 很 多 的 编码 方式 已 经 被 开发 出 来 了 ， 
这 些 编码 方式 使 接收 器 能 够 正确 解码 收 到 的 信号 并 复原 定时 信息 和 传输 的 数据 。 

实现 申 行 传输 有 两 种 基本 的 方法 。 对 于 速度 不 超过 几 十 kb/s 的 数据 传输 ， 可 以 采用 一 种 简单 
的 方式 。 在 这 种 方式 中 发 送 器 和 接收 器 使 用 独立 的 时 钟 信 号 ， 这 两 种 时 钟 信号 有 相同 的 额定 频 
率 ， 但 不 需要 保证 两 个 时 钟 信号 有 完全 相同 的 相位 和 频率 。 因 此 这 种 方式 被 称 为 异步 传输 。 后 
面 将 要 简要 介绍 的 起 止 方式 就 是 这 种 方法 的 一 个 普通 例子 。 

在 高 速 传输 数据 时 需要 使 用 同步 传 偷 。 在 同步 传输 中 ， 接 收 端 连续 地 监测 收 到 信号 的 跳 变 
位 置 并 相应 调节 本 地 时 钟 的 相位 ， 以 此 来 复位 发 送 器 的 时 钟 定 时 信息 。 这 样 接收 端的 时 钟 就 与 
发 送 器 的 时 钟 同 步 了 ， 可 以 用 来 正确 复原 传输 的 数据 。 可 以 用 来 在 同步 连接 上 编码 定时 信息 的 
技术 很 多 ， 由 于 利用 带宽 的 能 力 不 间 从 而 得 到 不 同 的 数据 传输 速率 。 

”全 双 工 和 半 双 工 连接 

一 个 通信 连接 可 以 按 以 下 三 种 方式 之 一 进行 操作 : 

单 工 方式 ， 只 允许 在 一 个 方向 上 进行 传输 ; 

半 双 工 方式 《HDX) ,允许 在 两 个 方向 上 进行 传输 但 不 能 同时 进行 ; 

全 双 工 方式 (FDX) ,允许 同时 在 两 个 方向 上 传输 。 

单 工 方 式 只 适用 于 在 远程 位 置 上 只 有 输入 和 输出 设备 两 者 之 一 的 情形 。 因 此 ， 单 工 方 式 很 
少 用 到 。 而 半 双 工 和 全 双 工 的 选择 要 综合 权衡 经 济 和 操作 速度 两 个 因素 。 

使 用 最 简单 的 电路 装置 ， 一 对 线路 可 以 使 传输 能 够 并 且 只 能 在 一 个 方向 上 进行 ， 这 就 是 单 
工 操作 。 而 要 实现 半 双 工 连接 ， 在 两 端 必须 使 用 开关 将 接收 器 或 发 送 器 连接 到 线路 上 ， 但 开关 
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不 能 同时 连接 接收 器 和 发 送 器 。 当 一 个 方向 上 的 传输 完成 后 ， 开 关 逆 置 使 得 相反 方向 上 的 传输 
可 以 进行 。 开 关 的 方向 由 线路 两 端的 设备 控制 。 

全 双 工 操作 可 以 在 四 线 连接 上 实现 ， 每 个 传输 方向 占用 两 条 传输 线 。 也 可 以 通过 使 用 两 个 
互 不 重 登 频 带 在 两 线 连接 上 实现 。 这 两 个 互 不 重 亚 频带 可 以 产生 两 个 独立 的 传输 通道 ， 每 个 方 
向 上 各 一 个 。 另 外 ， 全 双 工 操作 还 可 以 在 线路 的 两 端 使 用 混合 器 的 普通 频带 上 实现 。 混 合 器 的 
作用 是 将 传输 方向 相反 的 信号 分 开 使 它们 互 不 干扰 。 拨 号 电话 连接 使 用 的 就 是 这 种 类 型 的 线路 。 

在 同步 半 双 工 操作 中 ， 当 传输 方向 逆 置 时 会 产生 时 间 延 迟 ， 因 为 发 送 器 的 调制 解 调 器 必须 
发 送 一 个 初始 化 信号 序列 ， 使 接收 器 调节 通道 环境 。 延 迟 的 长 短 取 决 于 调制 解 调 器 和 传输 设备 ， 
可 能 从 几 毫 秒 到 一 百 多 毫秒 不 等 。 

上 面 讲述 的 是 有 关 传 输 连接 和 调制 解 调 器 的 特性 。 此 外 ， 数 据 传输 的 本 身 特性 和 系统 对 传 
输 错误 的 反应 方式 也 是 影响 选择 半 双 工 或 全 双 工 的 重要 因素 。 在 这 里 我 们 只 讨论 第 -一 个 因素 。 

许多 计算 机 应 用 要 求 计算 机 接收 输入 数据 ， 进 行 一 些 处 理 ， 然 后 返回 输出 数据 。 对 于 这 类 
应 用 ， 半 双 工 连接 就 能 满足 要 求 。 但 是 ， 如 果 线 路 两 端 交换 的 信息 短 且 频繁 ， 转 换 传输 方向 引 
起 的 延迟 就 不 可 忽略 了 。 因 为 这 个 原因 ， 实 际 中 许多 应 用 都 使 用 全 双 工 传输 方式 ， 即 使 实际 的 
数据 传输 从 不 同时 在 两 个 方向 上 进行 。 

在 有 些 情况 下 , 在 两 个 方向 上 能 够 同时 传输 数据 有 着 相当 大 的 优势 。 如 图 10-2 所 示 的 系统 中 ， 
计算 机 的 使 用 者 可 能 希望 将 计算 机 作为 一 个 视频 终端 直接 与 网 络 服务 器 对 话 。 如 果 这 样 的 话 ， 
在 键盘 上 输入 的 每 一 个 字符 都 应 该 回 显 在 计算 机 屏幕 上 ， 这 项 功能 可 以 由 计算 机 本 地 完成 ， 也 
可 以 由 网 络 服务 器 远程 完成 。 使 用 远程 回 显 时 还 可 以 提供 一 个 自动 检查 的 功能 来 确保 传输 过 程 
中 没有 发 生 任何 错误 。 使 用 远程 回 显 时 ， 如 果 采 用 半 双 工 连接 ， 那 么 下 一 个 字符 必须 延迟 到 前 
面 的 字符 回 显 后 才能 发 送 。 然 而 如 果 采 用 全 双 工 操作 就 没有 这 种 限制 了 。 全 双 工 传输 适用 的 另 
一 个 例子 是 高 速 计算 机 通信 网 络 中 节点 间 的 连接 。 在 任 一 个 连接 中 相反 方向 上 传输 的 信息 之 间 
是 没有 任何 联系 的 ， 因 此 它们 就 可 以 同时 传输 。 


10.3.1 异步 传输 


串 行 通信 最 简单 的 方式 是 采用 起 止 技术 的 异步 通信 。 为 了 便于 复位 定时 信息 ， 数 据 被 组 织 
成 带 有 明确 定义 的 起 点 和 终点 的 6 到 8 位 的 小 组 。 典 型 情况 下 ， 字 符 在 8 位 内 编码 按照 图 10-3 所 示 
进行 传输 。 连 接 发 送 器 和 接收 器 的 线路 闲置 时 状态 为 1, 传 输 字符 前 有 一 位 0 作为 起 始 位 ， 后 面 紧 
接着 的 是 8 个 数据 位 和 1 或 2 个 终止 位 ， 终 止 位 的 逻辑 值 为 1。 起 始 位 的 作用 是 提醒 接收 器 数据 传 
输 即 将 开始 ， 它 的 前 沿用 来 同步 接收 器 和 发 送 器 的 时 钟 。 末端 的 终止 位 在 连续 传输 时 用 来 描述 
连续 的 字符 。 当 传输 结束 时 ， 终 止 位 之 后 线路 保持 1 状态 。 插 入 和 删除 起 始 位 和 终止 位 由 发 送 器 
和 接收 器 电路 完成 。 

为 了 保证 接收 器 能 正确 同步 ， 接 收 器 的 时 钟 取 自 于 一 个 频率 远 高 于 传输 速率 的 本 地 时 钟 ， 
一 般 要 高 出 16 倍 。 这 就 是 说 在 每 一 个 数据 位 间隔 期 间 可 以 产生 16 个 时 钟 脉冲 。 这 个 时 钟 用 来 使 
一 个 模 16 的 计数 器 增 大 ， 该 计数 器 当 检测 到 起 始 位 的 前 沿 时 被 重 置 为 0。 当 计数 达到 8 时 ， 表 示 
已 经 达到 了 起 始 位 的 中 间 位 置 。 这 时 ， 起 始 位 的 值 被 取样 来 确认 它 是 一 个 有 效 的 起 始 位 ， 同 时 
计数 器 再 一 次 被 重 置 为 0。 从 这 一 点 往 后 ， 每 当 计数 达到 16 就 对 输入 的 数据 信号 取样 一 次 ， 此 时 
应 当 接近 每 一 传输 位 的 中 间 位 置 。 因 此 ， 只 要 传输 字符 中 位 的 相对 位 置 发 生 错 误 的 长 度 不 超过 
时 钟 局 期 的 一 半 ， 接 收 器 都 可 以 正确 解释 字符 编码 中 的 每 一 位 。 
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! 始 位 | 1 位 时 1 或 2 个 终止 位 = 新 字符 的 
起 始 位 位 时 间 atel 


刚 10-3 异步 串 行 字符 传输 


在 商业 性 的 设备 中 有 许多 传输 速率 标准 ， 从 300 到 56 000 比 特 / 秒 的 范围 内 。 起 止 传输 方式 主 
要 用 于 短 距 离 的 连接 ， 如 图 10-2 中 计算 机 和 调制 解 调 器 的 连接 。 对 于 更 长 距离 的 连接 ， 如 图 中 两 
个 调制 解 调 器 之 间 的 连接 ， 起 止 方式 只 能 在 很 低 的 速度 下 使 用 。 高 速 调制 解 调 器 一 般 使 用 下 一 
节 将 要 讲述 的 同步 传输 方式 。 

在 传输 字符 时 ， 字 符 通常 用 7 位 ASCII 码 (AERE) 来 表示 ， 占 用 图 10-3 中 的 位 0 到 位 6。 
MSB 为 传输 字 节 中 的 第 7 位 ， 通 常 置 0。 此 外 ， 它 也 可 以 用 作 奇 偶 校 验 位 以 辅助 检测 传输 错误 。 
奇偶 校 验 位 的 值 等 于 位 组 的 总 和 对 2 取 模 。 因 此 ， 如 果 传 输 的 数据 包含 奇数 个 1， 那 么 它 就 等 于 1， 
否则 就 等 于 0。 使 用 奇偶 校 验 位 时 它 是 由 发 送 器 设置 的 ， 这 样 传输 的 8 位 数据 的 奇偶 性 就 不 会 改 
变 了 ,或 奇 或 偶 。 如 果 传 输 错误 导致 其 中 一 位 的 值 被 改变 ， 接 收 器 就 会 检测 到 ， 从 而 可 以 确定 
已 经 发 生 了 错误 。 

ASCII 码 字符 包括 字母 、 数 字 和 特殊 符号 (如 $、+ 和 > )， 也 包括 很 多 非 印刷 字符 ， 例 如 ， 
EOT (传输 结束 ) 和 CR ( 回 车 )。 这 些 字符 可 以 用 来 请 求 特殊 的 操作 ， 尤 其 是 在 给 远程 计算 机 发 
送信 息 或 从 远程 计算 机 上 接收 信息 时 。 


10.3.2 同步 传输 


上 面 描述 的 起 止 方式 中 ， 起 始 位 的 开始 有 一 个 1 到 0 跳 变 ， 如 图 10-3 所 示 ， 这 个 跳 变 的 位 置 是 
获取 正确 定时 信息 的 关键 。 因 此 ， 只 有 在 传输 速度 足够 低 和 传输 连接 中 的 方形 波形 状 保持 不 变 
的 情况 下 ， 这 种 方式 才 是 可 用 和 的。 对 于 高 速 、 长 距离 的 连接 常常 会 发 生 大 量 的 信号 衰减 。 图 10-4 
中 显示 的 许多 位 在 彼此 的 顶部 重合 的 情形 ， 说 明了 波形 是 怎样 从 一 个 位 的 位 置 变 化 到 另 一 个 位 
的 位 置 的 。 信 号 衰减 是 由 信号 变形 之 类 的 因素 引起 的 ， 这 些 因素 是 由 线路 、 传 输 设备 、 邻 近 干 
扰 源 、 拌 动 (信号 跳 变 位 置 的 随机 变化 ) 等 导致 的 。 根 据 每 一 位 中 间 区 域 的 形状 ， 该 图 称 传输 
连接 的 眼 孔 图 。 复 杂 的 编码 和 解码 方法 被 用 来 帮助 接收 器 确定 眼 孔 图 的 中 点 位 置 ， 在 这 个 中 点 
位 置 1 和 0 相隔 最 远 ， 这 是 对 接收 到 的 信号 进行 取样 的 最 佳 点 。 


图 10-4 连续 位 的 重 番 跳 变 眼 孔 图 


在 同步 传输 中 ， 数 据 是 以 块 为 单位 进行 传输 的 ， 每 一 块 包括 几 百 到 几 千 个 比特 。 在 每 一 块 
的 开始 和 结束 都 使 用 了 适当 的 代码 来 标记 ， 块 内 数据 是 按照 约定 的 规则 组 织 的 。 调 制 解 调 器 需 
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要 一 段 较 长 的 起 止 时 间 来 完成 发 送 和 检测 载波 频率 、 建 立 同步 等 操作 。 在 一 些 调制 解 调 器 中 ， 
起 止 时 间 也 被 用 来 调节 调制 解 调 器 电路 与 连接 的 传输 特性 相 适 应 。 

网 络 连 接 一 一 ADSL 

近年 来 ， 特 别 是 随 着 网 络 的 广泛 使 用 ， 在 家 里 或 办 公 室 通过 高 速 连接 接 入 Internet 的 需求 越 
来 越 多 。 到 目前 为 止 ， 现 有 的 调制 解 调 器 仍 不 能 满足 需求 。 传 统 的 调制 解 调 器 将 数字 信号 转换 
为 模拟 形式 ， 使 用 电话 线 的 4kHz 的 声音 频带 。 当 一 台 计 算 机 使 用 这 种 调制 解 调 器 与 另 一 台 计 算 
机 通信 时 ， 这 条 线路 就 不 能 打 普 通电 话 。 更 为 重要 的 是 ， 传 输 速率 只 能 达到 几 十 kby/s, 这 远 小 于 连 
接 到 远程 服务 器 或 Intemet 所 需 的 速度 。 

传统 的 电话 技术 只 利用 了 电话 线 的 很 小 一 部 分 信息 传输 能 力 。 依 赖 于 传输 距离 和 线路 状况 ， 
现代 通信 技术 可 以 使 电话 系统 中 的 双 绞 线 上 的 最 高 速度 达到 50Mb/s。 许 多 方案 已 经 被 开发 出 来 ， 
利用 这 些 尚 未 使 用 的 传输 能 力 ， 这 些 方案 直接 以 数字 形式 在 用 户 家 中 或 工作 中 与 电信 公司 的 电 
话 总 机 之 间 传 输 信息 。 电 话 公司 将 电话 总 机 与 用 户 之 间 的 连接 称 为 用 户 环 路 。 因 此 ， 当 采用 数 
字形 式 传输 时 ， 这 种 方式 被 称 为 数字 式 用 户 环 路 (DSL). 

计算 机 通信 完全 依赖 于 不 同 部 门 提供 的 设备 和 服务 之 间 的 协同 工作 ， 这 些 部 门 包括 计算 机 
公司 、 调 制 解 调 器 制造 商 、 网 络 服务 提供 商 。 因 此 ， 在 一 些 被 大 家 都 接受 了 的 标准 上 达成 一 至 
是 十 分 必要 的 。 在 DSL 领 域 ， 只 有 很 少 的 标准 ， 包 括 SDSL (对 称 DSL)、HDSL (高 速 DSL) 和 
ADSL (不 对 称 DSL)。 其 中 ，ADSL 是 将 家 用 个 人 电脑 连接 到 Internet 上 使 用 的 最 广泛 方式 。 下 面 
我 们 简要 讲述 一 下 这 种 方式 的 主要 特性 。 

ADSL 中 的 不 对 称 是 指 上 行 方向 和 下 行 方向 的 传输 速率 不 同 。 在 大 部 分 时 间 里 ， 从 计算 机 发 
送 到 Internet 服 务 器 〈 上 行 方向 ) 的 信息 是 用 户 的 输入 信息 ， 这 时 只 需 一 个 低速 连接 就 足够 了 。 
而 流向 用 户 的 信息 ， 如 在 计算 机 屏幕 上 显示 图 像 ， 则 需要 高 速 连接 以 提供 良好 的 响应 。 因 此 ， 
ADSL 中 下 行 方向 的 传输 速度 要 比 上 行 方向 的 传输 速度 大 得 多 。 

ADSL 方 式 使 用 不 同 的 频带 和 时 分 多 路 复 用 技术 得 到 多 个 通信 通道 。 其 中 一 个 分 配给 日 常 的 
电话 ， 其 他 的 分 配给 上 行 方向 和 下 行 方向 上 的 数据 传输 。 图 10-5 所 示 的 是 一 种 典型 的 布局 。 图 中 
使 用 单 根 双 绞 线 在 电话 总 机 与 用 户 之 间 传 输 信 息 ， 在 每 一 端 有 一 个 分 离 器 将 数据 传输 与 声音 信 
号 分 开 。 在 用 户 端 ， 数 据 通过 适当 的 数据 连接 如 以 太 网 和 USB 连 接 输入 到 计算 机 中 ， 声 音信 号 被 
发 送 到 电话 机 。 在 电话 总 机 端 ， 数 据 被 发 送 到 与 Intermet 相 连 的 路 由 器 ， 声 音信 号 被 发 送 到 电话 
交换 机 。( 路 由 器 是 一 个 用 来 在 数据 网 络 中 指挥 传输 的 交换 设备 。 ) 采用 这 种 布局 可 以 使 计算 机 
不 拨号 就 能 与 Intermet 随 时 保持 连接 ， 同 时 日 常 的 拨号 电话 服务 也 可 以 继续 使 用 。 

电缆 调制 解 调 器 

电缆 调制 解 调 器 是 另 一 种 将 家 庭 计算 机 连接 到 Internet 的 方法 。 它 使 用 有 线 电视 连接 取代 了 
电话 连接 。 由 于 有 线 电视 中 使 用 的 同 轴 电 缆 的 带宽 要 比 双 绞 线 大 得 多 ， 因 此 使 用 电缆 调制 解 调 
器 能 达到 的 最 高 速度 要 高 于 DSL 的 速度 。 然 而 ， 由 于 有 线 电视 对 一 个 邻近 区 域 的 所 有 用 户 使 用 的 
是 类 似 于 总 线 的 连接 ， 所 以 电缆 的 信息 运输 能 力 被 所 有 连接 用 户 共享 。 对 于 每 一 个 用 户 ， 全 部 
运输 能 力 只 有 在 这 根 电缆 上 的 其 他 用 户 都 未 使 用 时 才能 达到 。 典 型 的 电缆 调制 解 调 器 布局 如 图 
10-6 所 示 。 


电缆 调制 解 调 器 系统 中 单个 用 户 获得 的 最 高 速度 依赖 于 网 络 服务 的 提供 商 ， 可 能 从 600kb/s 
到 10Mb/s 不 等 。 
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图 10-5 ADSL 连 接 


图 10-6 电费 调制 解 调 器 连接 
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10.3.3 标准 通信 接口 


标准 接口 指 的 是 将 两 个 设备 连接 起 来 的 点 的 集合 。 其 中 一 个 已 经 得 到 广泛 认可 的 标准 是 EIA 
(电子 工业 协会 ) 的 RS-232-C。 在 北美 以 外 的 地 区 称 之 为 CCITT Recommendation V24。 这 个 标准 
完整 地 规定 了 数据 通信 设备 之 间 的 接口 ， 如 调制 解 调 器 与 数据 终端 设备 (如 计算 机 ) 之 间 的 接 
口 。RS-232-C 接 口 由 25 个 连接 点 组 成 ， 表 10-2 对 它们 进行 了 描述 。 

下 面 看 一 个 简单 又 常见 的 例子 。 考 虑 图 10-2 中 的 连接 、 假 设 使 用 的 是 电话 拨号 网 络 。 所 用 的 
调制 解 调 器 可 以 接 通 和 挂 断 、 发 送 拨号 音 和 检测 收 到 的 振 铃 信号 。 采 用 的 传输 方式 是 前 面 所 描 
述 的 FSK 方 式 ， 能 进行 全 双 工 通信 。 拥 有 两 个 传输 信道 ， 每 个 方向 一 个 ， 一 个 信道 使 用 频率 
127SHz 和 1075Hz， 另 一 个 使 用 频率 222SHz 和 2025SHz 来 分 别 表示 逻辑 1 和 0。 

图 10-7 给 出 了 建立 连接 、 传 输 数据 和 终止 连接 所 需 的 逻辑 信号 序列 。 该 过 程 包括 的 步骤 简要 
描述 如 下 : 

1. 当 网 络 服务 器 准备 好 接收 一 次 访问 时 ， 将 数据 终端 就 绪 信号 (CD) 置 1。 

2. 调制 解 调 器 B 监 控 电 话 线 ， 当 检测 到 一 个 振 铃 电流 时 ， 表 示 收 到 一 个 呼叫 ， 就 将 振 铃 指示 
器 (CE) 置 1 通知 服务 器 。 如 果 当 振 铃 电流 被 检测 到 时 CD=1， 调 制 解 调 器 就 自动 应 答 呼 叫 ， 然 
后 将 调制 解 调 器 的 就 绪 信号 (CC) 置 为 1。 

3. 服务 器 通过 将 请 求 发 送 (CA) 置 1 指示 调制 解 调 器 B 开 始 发 送 代表 1 的 频率 (2225Hz) 信 
号 。 完 成 这 个 操作 后 ， 调 制 解 调 器 B 将 允许 发 送 (CB) 置 为 1。 当 调制 解 调 器 A 检测 到 这 个 频率 
的 信号 后 ， 就 将 接收 线路 信号 检测 器 (CF) 置 为 1。 

4. 计算 机 将 CA 置 为 1。 调 制 解 调 器 A 发 送 1275Hz 的 信号 并 将 CB 和 CC 置 为 1。 当 调制 解 调 器 B 
检测 到 1275Hz 频 率 的 信号 后 将 CF 置 为 1。 

5. 至 此 一 个 全 双 工 连接 就 在 服务 器 与 计算 机 之 间 建 立 了 ， 它 可 以 在 两 个 方向 上 传输 数据 。 
接口 引 脚 BA (发 送 数据 ) 和 BB (接收 数据 ) 数据 传输 ， 接 口中 所 有 其 他 信号 保持 不 变 。 

6. 当 使 用 者 要 结束 时 ， 服 务 器 将 请 求 发 送 和 数据 终端 就 绪 信号 CA 和 CD 置 0， 使 调制 解 调 器 B 
终止 2225Hz 的 信号 并 从 线路 上 断 开 。 信 号 CB、CF 和 CC 也 被 调制 解 调 器 B 置 0。 当 调制 解 调 器 A 检 
测 到 线路 上 的 信和 号 销 失 时 ，、 将 接收 线路 信号 检测 器 (CF) WO. 

7. 调制 解 调 器 A 将 它 的 1275Hz 的 信号 从 线路 上 撤销 ， 将 CB 和 CC 置 为 0， 并 挂 断 。 

8. 服务 器 将 数据 终端 就 绪 (CD) 置 1， 准 备 下 一 次 呼叫 。 


表 10-2 EIA 标 准 RS-232-C 信 号 一 览 表 (CCITT Recommendation V24) 
一 一 一 一 一 一 -一 -一 -一 ~ vv 


名 称 
引 脚 ' 号 功能 
EIA CCITT 
A 
AB 102 7 公共 地 返回 信号 
BA 103 2 发 送 数 据 
BB 104 3 接收 数据 
CA 105 4 请 求 发 送 
CB 106 5 A VF S 
cc 107 6 数据 通信 设备 就 绪 
CD 108.2 20 数据 终端 就 绪 
CE 125 22 振 铃 指示 器 


一 -~ aaao aaa 





( 续 ) 
— —*&—⁄ — 引 脚 “号 功能 
EIA CCITT 
CF 109 8 接收 线路 信和 号 检测 器 
CG 110 21 信号 质量 检测 
CH 1 238 数据 信号 速率 选择 〈 从 DTE+ 到 DCE# ) 
Cl 112 23 8 数据 信号 速率 选择 〈 从 DPCE 了 到 DTE+ ) 
DA 113 24 发 送信 号 单元 定时 (DTE+ ) 
DB 114 15 发 送信 号 单元 定时 (DCE} ) 
DD 115 17 接收 信号 单元 定时 (DCE ) 
SBA 118 14 二 级 发 送 数据 
SBB 119 16 二 级 接收 数据 
SCA 120 19 二 级 请 求 发 送 
SCB 121 13 二 级 允许 发 送 
SCF 122 12 二 级 接收 线路 信号 检测 器 
* 引 脚 9 和 10 用 于 测试 ， 引 脚 11、18 和 和 25 闲置 
十 “数据 终端 设备 
下 ”数据 通信 设备 


8 ”该 引 脚 上 信号 的 名 称 取决 于 信号 的 方向 


使 用 调制 解 调 器 进行 初始 连接 的 过 程 包括 信息 交换 ， 在 交换 的 信息 中 ， 双 方 在 将 要 使 用 的 
编码 方式 、 传 输 速 度 、 数 据 块 大 小 等 参数 上 达成 一 致 。RS-232-C 接 口 能 够 为 两 个 数字 化 设备 提 
供 趾 行 连接 。 单 个 信号 如 CA 和 CD 的 解释 依赖 于 有 具体 设备 的 功能 。 如 果 不 需要 这 些 信 号 ， 双 方 设 
备 就 将 它们 忽略 掉 。 大 部 分 应 用 中 使 用 的 信号 不 超过 表 10-2 中 所 列 的 9 个 信号 。 


10.4 结束 语 


本 章 主要 介绍 了 输入 和 输出 设备 的 概况 以 及 它们 的 操作 原理 。IMO 设 备 是 计算 机 系统 的 基本 
组 成 部 分 ， 它 们 为 向 计算 机 输入 信息 和 从 计算 机 接收 结果 建立 了 连接 。 近 年 来 又 出 现 了 许多 创 
新 的 设备 。 高 品质 且 价格 可 以 接受 的 输出 设备 已 经 向 个 人 计算 机 提供 了 。 可 用 的 输入 设备 的 范 
围 也 在 继续 扩大 ， 包 括 数字 照相 机 和 各 种 手持 设备 。 

本 章 也 介绍 了 计算 机 通信 方面 的 内 容 ， 特 别 是 在 串 行 连接 中 使 用 的 基本 技术 。 串 行 连 接 普 
遍 应 用 于 连接 计算 机 与 MO 设备 或 其 他 计算 机 。 还 介绍 了 一 些 通过 普通 传输 设施 (电话 网 络 ) 和 
有 线 电 视 网 高 速 连接 到 Intemet 的 例子 。 这 些 设备 的 广 谤 使 用 产生 的 互 连 性 ， 改 变 了 我 们 使 用 计 
算 机 的 方法 并 开发 出 了 大 量 的 家 庭 和 商业 上 的 应 用 。 正 是 计算 机 和 通信 两 个 领域 的 合作 引领 了 
当今 的 信息 技术 时 代 。 


习题 
10.1 视频 显示 器 每 秒 钟 芯 须 至 少 刷新 30 次 以 保持 屏幕 不 闪烁 。 在 每 一 次 完全 扫描 屏幕 时 ， 用 来 
照 亮 每 个 点 的 总 时 间 是 1us。 然 后 电子 束 炉 灭 并 移 至 下 一 个 要 被 照 亮 的 点 。 平 均 起 来 ， 将 电 


子 束 从 一 点 移动 到 另 一 点 需要 花费 34s。 由 于 受 能 量 损耗 的 限制 ， 电 子 束 的 照 亮 时 间 不 能 超 
过 这 段 时 间 的 10%。 计 算 屏幕 上 能 被 照 亮 的 点 的 最 大 值 。 
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有 一 个 通信 信道 ， 它 使 用 8 进 制 信号 代替 一 元 通道 中 使 用 的 2 进 制 信号 。 如 果 这 个 信道 的 波 
特 率 为 9600 波 特 / 秒 ,那么 它 每 秒 钟 传输 多 少 比 特 ? 

有 以 下 组 件 可 用 : 

"一 个 6 位 二 进 制 计数 器 ， 有 时 钟 、 清 零 输 入 和 6 个 输出 

“一 个 3 位 串 行 输入 并 行 输出 移 位 寄存 器 

“ 一 个 运行 速率 是 输入 速率 8 倍 的 时 钟 

“ 有 预 置 和 清 零 控 制 的 逻辑 门 和 D 触 发 器 

使 用 这 些 组 件 设计 一 个 电路 将 3 位 串 行 数据 从 数据 输入 线路 装 人 到 移 位 寄存 器 中 。 假 设 数 
据 的 格式 如 图 10-3 所 示 ， 但 只 有 3 位 而 不 是 8 位 数据 。 你 设计 的 电路 应 该 有 两 个 输出 A 和 B， 
两 者 初始 时 都 被 清 0。 如 果 在 数据 位 后 检测 到 一 个 终止 位 ， 就 将 输出 A 置 1。 否 则 ， 输 出 B 置 
1。 对 你 的 设计 给 出 操作 说 明 。 

一 个 两 台 计 算 机 之 间 的 异步 连接 使 用 起 止 方式 ， 有 一 个 起 始 位 和 一 个 终止 位 ， 传 输 速率 为 
38.8Kb/s。 这 两 台 计 算 机 可 得 到 的 有 效 传输 速率 是 多 少 ? 

一 个 通信 连接 对 每 个 传输 字符 使 用 了 奇 校 验 。 参 考 附 录 E， 给 出 字符 A、P、= 和 5 的 8 位 传 
输 格式 。 

有 一 个 通信 线路 调制 解 调 器 通过 RS5-232-C 接 口 连接 到 计算 机 上 。 计 算 机 可 以 通过 一 个 16 位 
寄存 器 访问 这 个 接 日 的 控制 信号 ， 如 图 P10-1 所 示 。 当 位 bz 或 bt 的 状态 发 生 改变 或 bs 被 置 
1 时 ， 状 态 变化 位 bs 被 置 1。 当 寄存 器 被 处 理 器 访问 后 ， 位 bs 被 清 0。 根 据 图 10-7 中 的 步 难 1 
到 步骤 4， 为 第 3 章 中 的 一 个 处 理 器 写 一 个 程序 来 执行 建立 电话 连接 所 需 的 控制 序列 。 


状态 变化 数据 就 绪 
CB 

四 四 四 加 
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图 P10-1 习题 10.6 中 调制 解 调 器 接口 的 MO 寄存 器 结构 
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第 11 章 


处 理 恬 系列 


本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

° 实现 RISC ISA 的 ARM、PowerPC、Sun SPARC, Compaq Alpha 以 及 Intel IA-64 处 理 器 系列 
* 实现 CISC ISAWJMotorola 680X0/ColdFire 和 Intel IA-32 处 理 器 系列 

。 具 有 操作 堆栈 数据 结构 指令 的 Hewlett-Packard HP3000 


第 2 章 介绍 了 如 何在 汇编 语言 级 别 上 实现 编程 的 基本 概念 ， 并 说 明了 各 种 必要 的 机 器 指令 和 
寻 址 方式 。 第 3 章 中 我 们 采用 ARM、Motorola 68000 和 Intel IA-32 指 令 集 的 体系 结构 作为 例子 。 在 
本 章 中 将 继续 讨论 这 三 个 指令 集体 系 结构 (ISA)， 并 详细 说 明 实现 ISA 晶 在 一 定价 格 和 性 能 区 间 
的 处 理 器 系列 中 各 个 成 员 的 特征 。ARM 体 系 结构 有 具有 RISC 的 特征 ，Motorola 和 Intel [A-32 体 系 结 
构 具 有 CISC 的 特征 。 我 们 要 描述 的 RISC 型 PowerPC 体 系 结构 ， 它 的 处 理 器 和 IA-32 处 理 器 具有 完 
全 相同 的 市 场 定位 。 还 要 讨论 具有 64 位 地 址 和 数据 宽度 的 Sun SPARC, Compaq Alpha 和 Intel IA- 
64 RISC 体 系 结构 。 这 些 64 位 处 理 器 主要 用 于 高 性 能 的 工作 站 和 服务 器 中 。 最 后 ， 我 们 会 用 一 种 
截然 不 同 的 基于 历史 重要 性 考虑 且 在 Hewlett-Packard HP3000 中 使 用 的 方法 ， 来 展示 如 何 为 一 台 
机 器 组 织 一 赛 指令 集 ， 使 它 通过 使 用 堆栈 数据 结构 来 保存 操作 数 ， 从 而 大 大 简化 它 的 计算 。 

第 2 章 、 第 3 章 、 第 7 章 和 第 8 章 中 描述 了 采用 RISC 和 CISC 方 法 进行 处 理 器 设计 。 在 举例 说 明 
它们 的 特征 之 前 ， 我 们 简要 回顾 一 下 每 种 方法 的 显著 特点 。CISC 指 令 集 提供 了 很 多 功能 强大 的 
指令 ,这 些 指 令 为 高 级 语言 操作 和 程序 排序 控制 结构 提供 更 为 直接 的 实现 方式 。 然而， 这 些 指 
令 的 执行 相对 来 说 也 更 加 复杂 。CISC 的 合理 之 处 在 于 对 于 一 个 给 定 的 高 级 语言 程序 ， 它 会 使 用 
较 少 的 机 器 语言 指令 ， 这 样 可 以 减少 程序 的 执行 时 间 。 如 果 复 杂 指 令 能 够 快速 高 效 地 执行 ， 那 
么 的 确 可 以 实现 减少 程序 的 执行 时 间 。 实 际 上 ， 实 现 具有 高 执行 效率 的 指令 已 经 被 实践 证 明 是 
极 具 挑战 性 的 ， 并 且 要 求 具有 比较 大 的 芯片 面积 。 此 外 ，CISC 指 令 集 很 难 在 优化 的 编译 器 上 使 
用 。 

因为 RISC 指 令 必须 执行 一 些 给 定 的 计算 任务 ， 使 用 相对 简单 的 RISC 方 法 最 初 与 CISC 相 比 效 
率 较 低 。 然 而 ，RISC 指 令 非 常 适合 用 于 可 以 提高 执行 效率 的 流水 线 操作 。RISC 指 令 集 最 重要 的 
优点 是 它 可 以 有 效 使 用 在 优化 编译 器 上 上。 另外 一 个 优点 是 关于 超大 规模 集成 电路 (VLSI) 制造 
技术 。 由 于 在 RISC 处 理 器 中 指令 操作 和 顺序 控制 所 需 的 芯片 面积 更 小 ， 这 样 可 以 有 更 多 的 空间 
来 设置 更 多 的 寄存 器 和 片上 高 速 缓存 。 

种 种 因素 表明 ， 尽 管 应 用 两 种 方法 都 生产 出 了 十 分 具有 竞争 实力 的 商业 产品 ， 但 是 ， 从 20 
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世纪 90 年 代 开 始 开发 的 新 机 型 中 RISC 型 ISA 已 经 具有 了 明显 的 优势 。 

正如 前 面 几 章 中 盖 述 的 那样 ， 我 们 必须 注意 在 设计 能 高 速 执行 指令 的 处 理 器 时 ， 除 了 指令 
集 的 类 型 外 ， 还 要 考虑 很 多 重要 的 因素 。 正 如 在 第 8 章 中 描述 的 ， 多 道 、 流 水 线 和 能 够 执行 超标 
量程 序 的 功能 单元 都 是 必 不 可 少 的 。 另 外 ， 从 高 级 语言 程序 生成 高 效率 机 器 语言 代码 的 优化 编 
译 器 也 必须 随 着 硬件 的 发 展 而 不 断 发 展 。 


11.1 ARM 系列 


在 第 3 章 的 部 分 I 中 ， 我 们 以 ARM 指 令 集体 系 结构 作为 RISC 类 型 的 例子 来 描述 指令 集 的 设计 。 
ARM 处 理 器 主要 用 于 借入 式 系统 的 应 用 中 。 因 此 ， 大 部 分 的 实现 要 求 必须 是 低 成 本 和 低 功 耗 的 。 
很 多 情况 下 ， 如 移动 电话 ， 目 标 设备 是 电 字 供电 的 ， 使 用 的 电压 范围 是 1 到 3 伏 。 相 对 于 面向 PC 
市 场 的 高 性 能 Intel Pentium 处 理 器 而 言 ， 低 档 的 ARM 处 理 器 降低 复杂 性 就 有 更 大 的 意义 了 ， 它 仅 
需要 Pentium 芯 片 中 的 部 分 晶体 管 电路 。 我 们 将 通过 讨论 ARM ISA 的 不 同 实现 方法 来 阐述 这 些 问 
题 。Furberm 的 著作 中 对 ARM 历 史 、 体 系 结构 和 实现 作 了 大 量 的 阐述 。《kIEEE Micro》 包 中 的 文章 
和 ARM 网 站 中 也 提供 了 详细 的 信息 。 

从 20 世 纪 80 年 代 中 期 到 2000 年 ，ARM ISA 已 经 具有 了 5 个 主要 版 本 ， 称 为 v1 到 v5。 版 本 v3 在 
第 3 章 中 已 经 描述 过 了 ， 这 个 版 本 采用 ARM7 处 理 器 ， 王 90 年 代 中 期 开发 实现 的 。 后 续 章 好 将 描 
述 处 理 器 的 实现 机 制 及 其 特点 。 

相对 于 版 本 v3，、 我 们 也 描述 一 下 其 他 版 本 的 一 些 特点 。 版 本 v1 和 版 本 v2 仅 支 持 26 位 存储 地 
址 ， 从 v1 到 v2 增加 了 32 位 的 乘法 指令 。 版 本 v3 全 部 采用 的 32 位 字 节 等 址 和 32 位 的 字 操 作 数 。 版 
本 v4 中 包含 64 位 和 32 位 乘积 的 乘法 指令 ， 又 增加 了 Load 和 store 指 令 ， 其 操作 数 是 16 位 ( 半 字 ) 数 
据 。 版 本 v5 以 及 标注 为 v5E 的 扩展 版 本 增加 了 专 有 指令 ;管理 程序 调试 时 的 软件 断 点 ， 为 软件 进 
行 浮 点 运算 而 进行 的 规格 化 ， 以 及 在 进行 16 位 操作 数 的 加 法 和 乘法 操作 时 人 允许 快速 处 理 数 字符 
号 的 程序 。 

除 ARM ISA 的 这 5 个 版 本 以 外 ， 还 有 一 种 将 指令 编码 成 32 位 字 格 式 ， 并 与 版 本 v4 和 v5 同 时 存 
在 的 一 种 压缩 的 编码 子 集 。 我 们 将 在 后 续 章 节 中 进行 阐述 。 


11.1.1 Thumb 指 令 集 


ARM ISA 说 明 书 中 包含 全 集 指令 版 本 v4 和 v5 的 一 个 压缩 编码 子 集 ,该 子 集 称 为 Thumb 指 今 集 ， 
并 且 版 本 名 扩展 成 v4T 和 v5T， 表 示 包 含 的 意义 。 所 有 的 Thumb 指 令 都 编码 成 16 位 的 半 字 格式 。 

Thumb 指 令 的 实际 作用 是 它 可 以 使 程序 占用 存储 空间 减 小 ， 以 便 可 以 用 在 低 成 本 、 低 功 耗 的 
嵌入 式 系 统 应 用 中 。ARM7TDM1 处 理 器 实现 了 体系 结构 中 的 v4T 版 本 。 访 处理 器 连同 一 个 小 容 
量 的 RAM 存 储 器 和 数字 信号 处 理 硬件 一 起 设计 在 同一 块 世 片上， 非常 适合 应 用 于 移动 电话 。 

由 Thumb 指 令 编制 的 程序 按照 如 下 方式 执行 。 指 令 从 存储 器 中 读 取 并 动态 地 (也 就 是 ， 在 执 
行 时 ) 从 高 度 编码 的 16 位 格式 “解压 缩 ”成 相应 的 标准 32 位 ARM 指 令 ， 然 后 再 执行 。 这 就 是 该 
指令 是 如 何在 主流 的 低 端 处 理 器 中 执行 的 方式 。 在 一 些 高 性 能 的 处 理 器 中 ，Thumb 指 令 可 以 省 略 
解压 缩 成 标准 的 ARM 指 令 的 步骤 ， 直 接 解码 成 可 执行 码 。 在 当前 程序 状态 寄存 器 (CPSR) 中 有 
一 位 标志 T 的 状态 位 ， 判 断 输入 指令 流 是 采用 Thumb 指 令 (T=1)， 还 是 标准 的 32 位 ARM 指 令 
(T=0)。 应 用 程序 可 以 包含 Thumb 指 令 和 标准 指令 的 混合 形式 。 

Thumb 指 令 和 标准 指令 之 间 的 两 个 主要 区 别 是 : Thumb 指 令 采 用 双 操 作 数 格 式 ， 目 标 寄 存 器 
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的 号 码 是 源 操 作 数 寄存 器 中 的 一 个 ; 而 在 标准 的 ARM 指 令 中 使 用 条 件 执行 指令 ， 在 Thumb 指 令 
集中 主要 用 转移 指令 。 这 些 变 化 会 明显 节省 指令 编码 位 的 空间 。 


11.1.2 处 理 器 和 CPU 内 核 


ARM 公 司 专门 生产 ARM 处 理 器 和 与 之 紧密 相关 的 部 件 ， 比 如 高 速 缓 存 和 存储 器 管理 单元 。 
生产 嵌入 式 系统 和 其 他 特殊 应 用 的 计算 机 产品 的 厂家 需要 把 这 些 设计 增加 到 他 们 的 产品 中 。 在 
大 多 数 情 况 下 ，ARM 的 设计 是 和 特殊 应 用 硬件 集成 在 同一 块 芯片 上 的 。 为 了 达到 所 需 的 用 途 ， 
ARM 设 计 被 称 为 核 。ARM 提 供 两 种 不 同形 式 的 设计 : 硬件 宏 单元 或 综合 形式 。 硬 件 宏 单元 是 针 
对 特定 芯片 制作 过 程 所 给 出 的 一 个 详细 物理 设计 图 。 综 合 形式 是 高 级 语言 软件 模块 ， 该 模块 可 
以 在 需要 的 目标 技术 中 使 用 一 个 合适 的 单元 库 进 行 合成 。 这 种 形式 基于 处 理 器 的 功能 可 供 选 择 ， 
并 且 很 容易 增加 和 删除 。ARM7TDMI 处 理 器 是 一 种 硬件 宏 单元 内 核 ，ARM7TDMI-S 则 是 它 的 综 
合 版 本 。 

ARM 设 计 可 以 用 处 理 器 内 核 或 CPU 内 核 进行 分 类 。 处 理 器 内 核 仅仅 包含 一 个 处 理 器 及 与 之 
相连 的 地 址 和 数据 总 线 。CPU 内 核 除 了 包含 处 理 器 以 外 ， 还 包含 高 速 缓存 和 存储 器 管理 部 件 。 这 
里 CPU 这 个 名 字 有 些 不 准确 ， 因 为 传统 意义 上 它 是 指 中 央 处 理 单元 ， 但 是 在 此 处 使 用 是 因为 它 是 
一 个 可 识别 的 ARM 术 语 。 现 在 ， 我 们 简要 描述 一 些 具 有 代表 性 的 处 理 器 和 CPU 内 核 。 

ARM7TDMI 处 理 器 内 核 

这 个 内 核 通 常用 在 低 成 本 、 低 功 耗 的 应 用 中 。 处 理 器 有 一 个 简单 的 3 段 流 水 线 ， 即 由 读 指 令 、 
编码 和 执行 3 个 阶段 构成 。 它 实现 了 版 本 v4T 的 体系 结构 ， 支 持 Thumb 指 令 集 和 标准 指令 集 。 典 
型 的 运行 参数 是 3.3V 电 压 和 66MHz 的 时 钟 频 率 。 另 外 这 个 内 核 还 能 支持 运行 电压 0.9V ， 为 低 功 
耗 的 电池 供电 应 用 进行 综合 ， 也 能 为 达到 更 高 性 能 而 使 时 钟 频率 超过 100MHz 的 应 用 进行 综合 。 

ARM9TDMI 和 ARM10TDMI 处 理 器 内 核 

这 两 个 处 理 器 内 核 分 别 采 用 5 段 和 6 段 流 水 线 。 相 对 于 ARM7TDMI 的 性 能 ， 它 们 有 单独 的 指 
令 和 数据 端口 ， 可 以 提供 更 高 的 性 能 。 当 处 理 器 的 时 钟 频率 为 200MHz 和 300MHz 时 ， 该 处 理 器 
内 核 中 的 版 本 7、 版 本 9 和 版 本 10 的 性 能 级 别 比 是 1 : 2 : 4。 相 对 其 他 两 种 处 理 器 的 32 位 通道 宽度 ， 
ARM10TDMI 的 每 个 存储 器 端口 通道 宽度 是 64 位 。ARM9TDMI 和 ARM10TDMI 分 别 实现 了 ISA 
的 版 本 v4T 和 v5TE。 它 们 都 是 直接 对 Thumb 指 令 进行 解码 执行 的 。 在 这 两 种 内 核 中 为 了 达到 更 高 
的 性 能 级 别 都 采用 了 高 速 缓存 进行 存储 。 

ARM720T CPU 内 核 

该 内 核 是 由 ARM7TDMI 处 理 器 内 核 、 一 个 8K 字 节 统 一 的 指令 数据 缓存 以 及 虚拟 存储 器 管理 
硬件 构成 。 缓 存 结构 是 16 字 节 的 块 ， 并 且 采 用 4 路 组 相 联 装置 。 存 储 器 管理 单元 使 用 一 个 64 入 口 
的 连接 转换 监视 缓冲 区 ， 该 缓冲 区 中 存放 最 近 一 次 的 转换 。 这 种 集成 单元 的 时 钟 频率 可 以 达到 
60MHz。 附 加 的 缓存 和 MMU 电 路 使 得 芯片 的 面积 增加 为 单独 处 理 器 所 需 面积 的 5 倍 ， 功 耗 是 原 
来 的 3 倍 。 

ARM920T 和 ARM1020E CPU 内 核 

这 些 CPU 内 核 以 ARM9TDMI 和 ARMI10TDMI 处 理 器 内 核 为 基础 ， 并 具有 分 离 的 指令 缓存 和 
数据 缓存 。ARM920T 中 的 每 个 缓存 包含 16K 字 节 ， 有 32 字 节 块 ， 有 64 路 的 组 相 联 装置 。 每 个 存 
储 器 端口 都 有 一 个 MMU， 并 且 每 个 MMU 都 有 64 人 和 人口 相 过 的 TLB 。ARM1020E 每 个 缓存 有 32K; 
此 外 ， 缓 存 和 MMU 与 前 者 相同 。 





581 


412 # 11 * 


StrongARM SA-110 CPU 内 核 

StrongARM CPU 内 核 是 ARM 公 司 与 DEC 公 司 (后 并 入 康 柏 公司 ) 合作 开发 的 ，SA-110 版 本 
是 Intel 公 司 制造 的 。 处 理 器 部 件 实现 了 版 本 v4 的 体系 结构 。 它 不 支持 Thumb 指 令 集 。 否 则 、 该 处 
理 器 可 以 与 ARM9TDMI 处 理 器 内 核 相 媲美 。SkongARM SA-110 的 性 能 与 ARM920T 相 似 ,但 是 它 
是 采用 早期 技术 实现 的 ， 并 且 在 200MHz 时 钟 频率 下 的 功 耗 较 大 。 

StrongARM 处 理 器 有 5 段 流 水 线 ， 有 分 离 的 16K 的 指令 和 数据 缓存 。 每 个 缓存 有 32 字 节 块 和 
32 路 组 相 联 装置 ， 每 个 转换 监视 缓冲 区 拥有 32 个 入口 。 为 了 在 数字 信号 处 理应 用 中 具有 良好 性 
能 ， 所 设计 的 高 速 乘法 器 电路 会 产生 3 个 时 钟 周期 以 上 的 延迟 。 


11.2 Motorola 680X0 和 ColdFire 系 列 


在 第 3 章 的 部 分 II 中 我 们 介绍 了 Motorola 68000 处 理 器 。 这 里 讨论 680X0 系 列 中 的 相继 处 理 器 
的 主要 特征 ， 以 及 与 之 有 密切 关系 的 ColdFire 系 列 。 在 Tabakm 的 著作 中 和 Motorola 网 站 5 上 对 这 
些 处 理 器 都 有 相关 的 描述 。 下 面 首先 对 Motorola 处 理 器 进行 一 般 性 的 说 明 。 

68000 处 理 器 于 1979 年 诞生 。 经 过 20 世 纪 80 年 代 和 90 年 代 初 ， 相 继 问世 的 68000、68020、 
68030 和 68040 的 主要 目标 是 个 人 计算 机 市 场 ， 这 些 处 理 器 由 苹果 计算 机 所 采用 。 最 新 的 680X0 系 
列 成 员 是 90 年 代 中 期 问世 的 68060。 与 68060 关 系 最 为 密切 的 是 ColdFire 系 列 ， 该 系列 处 理 器 主要 
面向 媒人 式 系 统 市 场 。 


11.2.1 68020 处 理 器 


由 于 68020 在 体系 结构 上 进行 了 重要 改进 ， 因 此 其 功能 比 68000 强 大 许多 。 改 进 的 VLSI 技 术 
和 更 大 的 外 包装 避 开 了 由 于 引 脚 的 局 限 性 带 来 的 诸多 约束 ， 从 而 为 其 进一步 的 改进 创造 了 可 能 
性 。 这 里 关于 68020 的 讨论 也 适用 于 68030 和 68040。 稍 后 ， 我 们 再 描述 68030 和 68040 性 能 中 的 其 
他 改善 。 

68020 提 供 32 位 地 址 和 32 位 数据 的 外 部 连接 。 尽 管 数据 总 线 宽度 是 32 位 的 ， 它 每 次 可 以 有 效 
地 处 理 设备 之 间 8 位 、16 位 和 32 位 的 数据 传输 。 该 处 理 器 可 以 根据 特定 设备 的 需要 动态 调整 数据 
总 线 的 宽度 ， 而 这 种 方法 对 于 程序 员 来 讲 是 透明 的 。68020 总 线 包 含有 控制 线 ， 这 些 挖 制 线 由 相 
连接 的 设备 激活 ， 指 示 该 设备 进行 数据 传输 时 所 需要 的 总 线 宽度 。 这 样 ， 处 理 器 就 能 处 理 不 同 
宽度 的 数据 传输 ， 而 无 需 在 数据 传输 初始 化 之 前 知道 实际 的 传输 宽度 。 

68000 中 规定 字 操作 必须 从 偶 地 址 开始 进行 ， 在 68020 中 取消 了 这 条 限制 ， 即 任意 长 度 的 操 
作 数 可 以 在 任意 地 址 开始 。 这 就 意味 着 16 位 和 32 位 的 操作 数 在 主 存 中 可 以 占用 两 个 相 邻 的 32 位 
位 置 。 因 此 ， 读 取 操 作 数 需要 两 个 访问 周期 ， 这 样 会 对 性 能 有 一 定 的 影响 .这 两 步 访 问 是 由 处 
理 器 自动 执行 的 。 处 理 器 可 以 从 地 址 中 判断 必须 访问 哪个 32 位 的 位 置 ， 以 及 这 些 位 置 的 每 个 字 
节 采 用 什么 样 的 组 装 方式 才能 获得 想 要 的 操作 数 ， 

寄存 器 集 和 数据 类 型 

与 68000 一 样 ，68020 中 的 操作 分 为 用 户 模式 和 管 态 模式 。 在 用 户 模式 下 ， 寄 存 器 变量 必须 
与 图 3-18 中 给 出 的 相同 。 而 在 管 态 模式 下 ，68020 有 几 个 额外 的 控制 寄存 器 来 简化 操作 系统 软件 
的 执行 。 

68000 可 访问 的 数据 单元 是 位 、 字 节 、 字 、 长 字 和 压缩 的 BCD 码 。 除 此 以 外 ，68020 还 可 以 
处 理 四 售 长 字 、 非 压缩 的 BCD 码 和 位 字段 的 数据 类 型 。 四 倍 长 字 由 64 位 组 成 ， 非 压缩 的 BCD 每 





个 字 节 是 一 个 BCD 数 。 位 字段 由 32 位 长 字 中 的 一 位 变量 构成 ， 它 通过 最 左 端的 位 及 字段 中 的 位 
数 来 指定 。 
寻 址 方式 
表 3-2 中 给 出 的 所 有 68000 的 寻 址 方式 ， 在 68020 中 也 都 是 有 效 的 。 为 了 增加 对 数据 和 地 址 表 
结构 访问 的 爱 活 性 和 高 效 性 ， 在 68020 中 又 增加 了 几 种 变 址 方式 的 版 本 。 
全 变 址 方式 是 比较 强大 的 方式 ， 因 为 它 允 许 一 定 范围 的 位 移 量 或 偏 移 量 ， 并 提供 一 个 比例 
因子 。 回 想 一 下 68000 的 全 变 址 方式 的 语法 : 
| disp ( An, Rk. size ) 
其 中 ， 位 移 量 是 一 个 带 符号 的 8 位 数 ， 指 定 的 size 用 来 表示 寄存 器 R4 是 32 位 的 还 是 16 位 的 ， 并 用 
来 计算 有 效 地 址 。 在 68020 中 这 种 方式 的 指令 允许 位 移 量 的 值 是 8 位 、16 位 或 32 位 。Rk 中 的 内 容 
进行 乘法 运算 时 引入 一 个 比例 因子 。 该 比例 因子 的 值 可 以 是 1、2、4 或 8。 该 方式 的 语法 是 : 
(disp, An, RK. size*scale ) 
注意 位 移 量 在 括 弧 中 给 出 。 有 效 地 址 EA 的 计算 如 下 : 
EA = disp + [An] + ([RkK] x scale) 
当 处 理 的 表 项 长 度 是 1、2、4 或 8 个 字 节 时 ， 这 种 方式 非常 有 效 。 如 果 适 当选 择 比例 因子 使 之 等 
于 表 项 的 长 度 ， 那 么 表 中 的 表 项 就 可 以 按照 对 寄存 器 RK 内 容 每 次 增 1 的 方式 进行 连续 的 访问 。 
另 一 种 变 址 寻 址 方式 的 强大 扩展 版 本 是 存储 器 间接 变 址 方式 ， 该 方式 中 的 操作 数 地 址 是 直 
接 读 取 主 存 的 地 址 。 这 两 种 方式 共同 存在 。 在 存储 器 间接 传递 变 址 (memory indirect postindexed ) 
方式 中 ， 进 行 正 常 的 变 址 处 理 之 前 ， 先 取出 存储 器 地 址 。 其 语法 是 : 
( [basedisp, An], RK. size * scale, outdisp ) 
有 效 地 址 计算 如 下 : 
EA = [basedisp + [An]] + ([RA] x scale) + outdisp 
注意 使 用 的 两 个 位 移 量 。16 位 或 32 位 的 基本 位 移 量 用 来 修改 An 中 的 地 址 ， 然 后 用 来 从 存储 器 中 
取出 操作 数 的 地 址 。 这 样 就 可 以 从 存储 器 中 保存 的 地 址 表 中 选择 一 个 地 址 ， 该 地 址 表 的 起 始 地 
址 在 An 中 给 出 。 第 二 个 位 移 量 是 用 于 变 址 寻 址 的 一 般 位 移 量 ， 为 了 与 基本 位 移 量 区 别 ， 它 被 称 
为 外 部 位 移 量 。 
第 二 个 版 本 是 存储 器 间接 预 变 址 (memory indirect preindexed) 方式 ， 其 中 大 部 分 的 变 址 修 
改 是 在 取出 地 址 操作 数 之 前 完成 的 。 该 方式 的 语法 是 : 
([basedisp, An, R£. size * scale], outdisp) 
有 效 地 址 的 计算 如 下 : 
EA = [basedisp + [An] + ([R£] x scale)] + outdisp 


在 这 两 种 方式 中 ，An、Rk、basedisp 和 outdisp 的 值 是 可 选 的 ， 除 非 用 户 特殊 指定 ， 否 则 这 些 值 在 
计算 有 效 地 址 时 不 被 使 用 。 当 处 理 连 续 存储 的 列表 时 ， 存 储 器 中 存储 的 是 数据 项 地 址 而 不 是 数 
据 项 本 身 时 ， 这 种 寻 址 方式 是 非常 有 用 的 。 数 据 项 可 以 存储 在 任何 位 置 上 。 

所 有 变 址 方式 的 相关 版 本 中 程序 计数 器 可 以 代替 地 址 寄存 器 An 来 使 用 。 

指令 集 


所 有 的 68000 指 令 在 68020 中 都 是 可 用 的 ， 击 且 其 中 的 一 些 指令 还 特别 灵活 。 例 如 ， 转 移 指 
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令 可 以 是 32 位 的 偏 移 量 ， 有 几 条 指令 可 以 选用 更 长 的 操作 数 。 指 令 集中 还 提供 了 一 些 新 指令 。 
比如 进行 位 字 节 操作 的 指令 。 

片上 高 速 缓 存 

68020 世 片 中 包含 一 个 很 小 的 指令 高 速 缓存 (cache )， 这 个 Cache 只 有 256 个 字 节 ， 可 构成 64 
个 长 字 块 ， 采 用 直接 映射 方式 向 Cache 中 装 和 人 新 的 字 。 


11.2.2 68030 和 68040 处 理 器 的 改进 


68030 与 68020 的 主要 区 别 有 两 方面 。68030 中 除了 具有 指令 高 速 缓存 以 外 ， 还 有 一 块 同 样 大 
小 的 高 速 缓存 用 来 存放 数据 。 数 据 高 速 缓存 有 16 个 块 ， 每 块 4 个 字 长 。68030 中 还 包含 一 个 存储 
器 管理 单元 (MMU). 

68030 中 的 执行 单元 产生 虚拟 地 址 。 高 速 缓存 访问 电路 根据 虚拟 地 址 来 判断 所 需要 的 操作 数 
是 否 在 高 速 缓 存 中 。MMU 将 虚拟 地 址 转换 成 物理 地 址 并 且 和 高 速 缓存 的 访问 同时 进行 ， 这 样 一 
且 高 速 缓存 访问 失败 ， 物 理 地 址 可 以 直接 从 内 存 中 访问 到 操作 数 。 

68040 中 包含 一 个 浮 点 单元 ， 该 单元 在 第 6 章 中 描述 过 ， 它 实现 了 IEEE 的 浮 点 标准 。 与 68030 
相同 ，68040 中 也 包含 指令 高 速 缓 存 和 数据 高 速 缓 存 。 其 存储 器 管理 比 68030 更 加 完善 ; 68040 中 
有 两 个 独立 的 地 址 转换 高 速 缓存 允许 同时 进行 指令 和 数据 的 地 址 转换 。 还 有 一 个 流水 线 结构 允 
许 在 前 面 的 指令 还 在 处 理 时 进行 取 指 令 操作 。 两 条 与 两 个 高 速 缓存 相连 的 内 部 总 线 分 别 用 来 进 
行 相应 的 指令 和 数据 传输 。 这 两 条 总 线 与 两 个 地 址 转换 电路 相连 ， 人 允许 同时 访问 指令 和 数据 高 
速 缓存 。 

最 后 ，68040 中 包含 监视 外 部 总 线 行为 的 电路 。 这 个 特点 使 得 68040 很 适合 用 于 多 处 理 器 系 
统 。 在 多 处 理 器 系统 中 的 一 个 关键 要 求 就 是 保持 不 同 处 理 器 高 速 缓存 中 暂 存 的 共享 数据 的 一 至 
性 。 关 于 如 何 通过 总 线 监视 电路 来 检测 改变 缓存 数据 的 总 线 传输 ， 我 们 将 在 第 12 章 中 描述 。 


11.2.3 68060 处 理 器 


最 新 的 680X0 成 员 是 在 90 年 代 中 期 提出 的 68060 外， 它 的 时 钟 频率 是 50 到 75MHz。 这 款 处 理 
器 主要 是 面向 伐 人 式 系 统 市 场 ， 新 的 组 织 结构 和 制造 特点 使 之 在 性 能 上 是 40MHz 68040 的 2.5 倍 。 

68060 是 一 个 基于 流水 线 的 超标 量 处 理 器 。 流 水 线 有 四 个 基本 段 和 两 个 附加 段 ， 共 中 的 两 个 
附加 段 在 存储 器 需要 回 写 时 使 用 。 该 处 理 器 每 个 时 钟 周期 可 以 发 出 三 条 指令 。 三 个 功能 单元 一 
两 个 整 型 单元 和 一 个 浮 点 单元 一 -构成 主要 的 指令 处 理 硬件 。 处 理 器 中 有 单独 集成 在 芯片 上 的 
8K 字 节 的 指令 和 数据 高 速 缓 存 。 每 个 高 速 缓存 是 4 路 组 相 联 装置 并 使 用 16 字 节 的 块 。 两 个 64 入 口 ， 
4 路 组 相 联 装置 ， 便 于 从 虚拟 地 址 到 物理 地 址 转换 的 转换 监视 缓冲 区 ， 这 些 部 件 中 都 提供 了 高 束 
缓存 。 该 处 理 器 采用 动态 的 转移 预 判 方法 ， 使 得 通过 流水 线 方式 读 取 的 指令 流 更 加 流畅 。 


11.2.4 ColdFire 系 列 





从 20 世 纪 90 年 代 中 期 开始 ，Motorola 已 经 生产 了 一 系列 处 理 器 部 件 和 小 型 结构 计算 机 ， 被 称 
为 ColdFire 系 列 ， 该 系列 处 理 器 主要 是 面向 由 入 式 系统 市 场 的 。 它 以 68060 处 理 器 内 核 为 基础 。 
为 了 进行 并 行 或 串 行 连接 ， 许 多 不 同 的 产品 中 配置 了 一 些 存储 器 或 1O 端 口 硬件 。 这 些 产品 是 为 
了 满足 各 种 应 用 的 不 同 功能 要 求 和 性 能 要 求 。 在 ColdFire 系 列 中 ， 硬 件 芯片 产品 和 综合 软件 设计 
都 是 可 实现 的 。 
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11.3 Intel IA-32 系 列 


Intel 处 理 器 中 广泛 应 用 于 笔记 本 电脑 和 个 人 计算 机 中 ， 并 且 事 实证 明 已 经 取得 了 很 大 的 商业 
成 功 。 在 20 世 纪 80 年 代 ，Intel 生 产 的 首 批 处 理 器 用 在 IBM PC 中 。 它 是 在 8086 处 理 器 的 基础 上 于 
1979 年 诞生 的 ， 外 部 地 址 宽度 是 20 位 ， 操 作 的 内 外 数据 宽度 是 16 位 (有 趣 的 是 3086 系 列 中 称 为 
8088 的 8 位 版 本 ， 实 际 上 首次 在 IBM PC 上 是 为 了 尽 可 能 降低 成 本 而 采用 的 )。 由 于 8086 的 封装 具 
有 40 个 引 脚 ， 所 以 地 址 和 数据 的 传输 在 必 片 的 同一 个 引 脚 上 通过 多 次 来 完成 。 

通过 对 相同 基本 指令 集体 系 结构 实现 的 发 展 和 完善 ， 相 继 问世 了 功能 更 强 的 处 理 器 。 它 们 
是 80286、80386 和 80486 以 及 当前 的 Pentium 系 列 。 其 中 ，80286 是 16 位 处 理 器 。 其 他 几 种 在 处 理 
内 外 部 数据 和 地 址 时 宽度 都 是 32 位 的 。80386 是 在 IA-32 系 列 中 的 第 一 款 处 理 器 。32 位 芯片 带 来 了 
更 大 的 封装 ， 这 样 可 以 避免 对 于 地 址 和 数据 线 多 路 复 用 的 需求 。 


11.3.1 IA-32 存 储 器 分 段 


在 3.16.1 节 中 ， 我 们 简要 讨论 了 使 用 段 寄 存 器 (参见 图 3-37) 来 产生 IA-32 体 系 结构 的 存储 器 
地 址 。 这 里 将 对 此 进行 详细 阐述 。 首 先 ， 要 指出 的 是 最 初 在 8086 中 是 怎样 使 用 段 寄存 器 的 。 由 
于 当前 的 IA-32 处 理 器 可 以 转变 成 段 寄存 器 操作 的 一 个 状态 ， 称 为 实 模式 ， 因 此 ， 当 前 的 IA-32 处 
理 器 具有 可 以 运行 8086 机 器 代码 程序 的 功能 。 

实 模式 

由 8086 处 理 器 使 用 的 这 种 地 址 生成 模式 ， 将 存储 器 看 成 由 段 构 成 ， 每 个 段 有 64K 字 节 。 一 个 
64K 的 存储 器 段 按 8086 寻 址 方式 可 以 用 16 位 的 有 效 地 址 在 内 部 生成 。 处 理 器 使 用 CS、SS、DS 和 
ES 段 寄 存 器 来 分 别 访问 代码 段 、 堆 栈 段 和 两 个 数据 段 。 在 80386 中 还 增加 了 另外 两 个 段 寄 存 器 
(FS 和 GS )。 

图 11-1 给 出 了 20 位 外 部 存储 器 地 址 的 生成 。16 位 的 段 寄 存 器 值 左 移 四 位 形成 20 位 的 地 址 ， 该 
地 址 作为 段 的 起 始 地 址 。 由 8086 寻 址 方式 产生 的 16 位 有 效 地 址 在 图 中 标 有 偏 移 量 ， 它 和 段 起 始 
地 址 相 加 产生 实际 需要 的 20 位 存储 器 地 址 。 

我 们 只 要 将 地 址 中 的 高 16 位 作为 该 段 的 起 始 地 址 保存 到 相应 的 段 寄 存 器 中 ， 就 可 以 将 段 放 
在 20 位 地 址 空间 中 的 不 同位 置 上 。20 位 的 地 址 总 共 可 以 生成 16 个 64K 的 非 重 又 段 ， 可 寻 址 的 存储 
器 总 容量 是 IM。 注 意 ， 段 是 可 以 重合 的 。 这 样 可 以 在 不 同 程序 之 间 进 行 指令 和 数据 的 共享 。CS 
和 SS 的 使 用 是 由 指令 和 所 涉及 的 堆栈 访问 自动 决定 的 。 访 问 数据 时 默认 使 用 的 是 DS 段 寄存 器 。 
在 使 用 ES 寄存 器 进行 数据 访问 时 指令 中 要 加 入 前 绥 字 节 码 。 
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图 11-1 8086 处 理 器 中 存储 器 地 址 的 生成 
保护 模式 
IA-32 体 系 结构 处 理 器 通常 采用 保护 模式 来 产生 存储 器 地 址 。 图 11-2 给 出 了 最 常用 的 利用 基 
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址 和 变 址 寄存 器 中 的 内 容 ， 以 及 指令 中 的 偏 移 量 来 产生 物理 地 址 的 方式 。 一 个 32 位 的 有 效 地 址 
通过 将 变 址 寄存 器 的 内 容 和 比例 因子 1、2、4 或 8 中 的 一 个 数 相 乘 ， 所 得 结果 再 与 基 址 寄存 器 内 
容 和 偏 移 量 的 和 相 加 而 得 到 。 从 六 个 段 奇 存 器 中 选 定 一 个 段 寄 存 器 (如 图 3-37 所 示 )， 用 它 的 高 
14 位 来 指定 一 个 选择 器 ， 该 选择 器 作为 一 个 段 描述 符 表 的 变 址 ， 并 通过 该 变 址 得 到 一 个 32 位 的 
基地 址 。 这 个 地 址 再 加 上 分 段 单 元 中 的 有 效 地 址 产生 一 个 32 位 的 线性 地 址 。 最 后 ， 由 分 页 单元 
利用 页 表 将 线性 地 址 转换 成 相应 的 32 位 物理 地 址 。 

段 描述 符 表 和 页 表 都 很 大 ， 所 以 一 般 放 在 内 存 中。 为 了 确保 快速 地 完成 地 址 转换 ， 采 用 了 
转换 监视 缓冲 区 ， 这 在 第 5 章 中 介绍 过 。 段 描述 符 表 包含 访问 权限 域 和 指定 一 个 段 的 最 大 空间 的 
段 限 制 域 。 这 些 参数 由 操作 系统 进行 管理 ， 这 样 可 以 在 不 同 的 应 用 程序 同时 占用 内 存 时 起 到 保 


护 作用 ， 因 此 将 其 命名 为 “保护 模式 ”。 
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图 11-2 IA-32 体 系 结构 中 的 地 址 生成 


分 段 和 分 页 的 特点 可 以 按 以 下 方式 中 的 任何 一 种 方式 构成 存储 器 : 
* 作为 32 位 寻 址 空间 中 的 一 片 使 用 ， 其 有 效 地 址 当 作物 理 地 址 使 用 。 
* 用 作 一 个 或 多 个 可 变 长 度 的 段 ( 没 有 分 页 )。 

“ 将 32 位 的 空间 划分 成 一 个 或 多 个 4K 的 页 。 

“将 分 段 和 分 页 结合 起 来 作为 一 种 结构 使 用 。 


11.3.2 16 位 模式 


IA-32 处 理 器 可 以 运行 在 一 种 特殊 的 模式 下 ， 该 模式 可 以 直接 执行 早期 的 16 位 Tntel 处 理 器 
(8086 和 80286) 编制 的 机 器 语言 程序 。 在 这 种 模式 下 ， 仅 仅 使 用 处 理 器 寄存 器 中 低位 部 分 ， 在 
图 3-38 的 处 理 器 中 标志 为 AX，CX，.…。 处 理 器 内 部 地 址 位 宽 是 16 位 ， 使 用 的 寻 址 方式 是 表 3.3 
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中 描述 的 子 集 。 例 如 ， 其 中 变 址 寄存 器 中 的 值 不 能 用 来 生成 有 效 地 址 。 

32 位 和 16 位 之 间 的 转换 操作 实际 上 是 通过 逐条 指令 来 完成 的 。 还 可 以 独立 选择 地 址 和 数据 
的 长 度 。 例 如 ，IA-32 的 所 有 寻 址 方式 都 可 以 和 16 位 数据 进行 联合 处 理 。 程 序 在 开始 执行 时 采用 
的 是 默认 模式 。 若 要 转换 成 其 他 模式 ， 只 需 在 指令 中 加 入 一 个 前 绥 字 节 即 可 。 这 一 点 在 图 3-41 中 
没有 给 出 。 


11.3.3 80386 和 80486 处 理 器 


在 第 3 章 中 介绍 过 80386 是 最 先 实现 IA-32 体 系 结构 的 处 理 器 。 它 支持 在 第 11.3.1 节 中 介绍 的 存 
储 器 分 段 和 分 页 技术 。 

80486 处 理 器 是 最 早 与 Motorola 68040 具 有 相同 数量 (100 万 个 ) 的 晶体 管 之 一 。 读 处 理 器 相 
对 于 80386 在 性 能 上 的 重要 改进 是 进行 电路 的 扩展 。80486 包 括 整 型 和 浮 点 处 理 单元 。 整 型 单元 
是 与 80386 处 理 器 完全 兼容 的 。 浮 点 单元 实现 了 在 第 6 章 中 介绍 的 IEEE 浮 点 标准 。 基 于 80386 的 计 
算 机 可 以 通过 使 用 协 处 理 器 芯片 而 具备 相同 的 功能 。80486 中 的 分 页 和 存储 器 管理 与 80386 不 同 。 

在 80486 中 包括 一 个 4 路 组 相 联 的 指令 和 数据 高 速 缓存 。 在 向 高 速 缓存 中 装 和 人 新 信息 时 为 提 
高 效率 ， 采 用 批量 数据 传送 机 制 ， 该 机 制 能 一 次 将 四 个 32 位 的 字 作为 一 块 装 入 高 速 缓存 中 。 高 
速 缓存 还 有 直接 写 的 特点 ， 任 何 写 入 高 速 缓 存 中 的 数据 同时 也 写 到 内 存 中 。 

为 了 具有 更 高 的 性 能 ，80486 采 用 了 并 行 机 制 和 流水 线 处 理 方法 ， 并 取得 了 明显 的 效果 。 整 
型 单元 和 浮 点 单元 可 以 并 行 执行 指令 。 当 执行 一 条 指令 时 ， 就 从 内 存 中 取出 后 续 的 指令 。 频 繁 
使 用 的 指令 执行 时 所 用 的 时 钟 周期 比 在 80386 中 要 少 。 而 对 于 装载 和 存储 数据 ， 或 执行 寄存 器 到 
寄存 器 的 操作 仅仅 需要 一 个 时 钟 周期 。 


11.3.4 Pentium 处 理 器 


1993 年 间 世 的 Pentium 处 理 器 外 的 性 能 相对 于 80486 而 言 有 了 极 大 的 提高 。80486 具 有 100 万 个 
晶体 管 ， 而 Pentium 中 达到 了 300 万 个 。 如 果 以 程序 中 的 整 型 运算 为 基准 ， 它 的 计算 能 力 是 80486 
的 两 倍 以 上 ; 如 果 以 程序 中 的 浮 点 运算 为 基准 ， 它 的 计算 能 力 大 约 是 80486 的 五 倍 左 右 。 

Pentium 处 理 器 采用 的 是 CISC 体 系 结构 ， 并 采用 了 很 多 RISC 处 理 器 结构 的 特点 ， 使 其 性 能 得 
到 了 很 大 的 提高 。 这 些 性 能 在 80486 中 还 只 是 低 程度 的 实现 ， 特 别 是 用 于 指令 和 数据 的 独立 专用 
的 8K 片 上 高 速 缓存 。 该 超标 量 处 理 器 由 多 流水 线 操作 单元 支持 ， 每 个 时 钟 周期 可 以 发 出 两 条 指 
令 。 由 于 外 部 数据 总 线 是 64 位 宽 ， 所 以 可 以 很 快 地 将 主 存 中 的 数据 装 人 高 速 缓存 中 。 高 速 缓存 
是 具有 32 字 节 块 的 2 路 组 相 联 装置 ， 其 包括 三 个 独立 流水 线 的 操作 单元 -一 两 个 用 于 整 型 运算 ， 
一 个 用 于 浮 点 运算 。 每 个 整 型 单元 流水 线 深度 是 5 段 ， 浮 点 单元 流水 线 深度 是 8 段 。 

Pentium 处 理 器 采用 简化 形式 的 动态 转移 预 判 技术 ， 选 择 最 后 一 次 执行 的 转移 方向 作为 程序 
的 执行 方向 。 为 此 ， 读 处 理 器 中 采用 了 地 址 表 ， 用 来 保存 每 次 转移 指令 最 后 转移 的 地 址 值 。 如 
果 从 转移 开始 到 循环 退出 ， 程 序 循环 中 所 有 转移 都 是 正确 的 ， 那 么 预 判 的 方向 就 是 正确 的 。 


11.3.5 Pentium Pro 处 理 器 
1995 年 问世 的 时 钟 频率 是 133MHz 的 Pentium Prol 10 在 性 能 上 较 时 钟 频率 为 100MHz 的 


Pentinm 棍 高 了 近 两 倍 。 该 处 理 器 性 能 的 提高 主要 取决 于 增加 了 超标 量 因素 以 及 具有 乱 序 执行 指 
令 的 能 力 。 超 标量 因素 ， 或 者 是 在 一 个 时 钟 周期 内 能 完成 的 指令 的 最 大 数量 ， 在 Pentium 处 理 器 
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中 是 每 个 时 钟 周期 两 条 指令 ， 而 在 Pentium Pro 中 达到 了 三 条 。 在 多 执行 单元 中 的 流水 线 深度 达到 
了 12， 而 在 Pentium 中 只 达到 5; 处 理 器 内 部 数据 通道 的 宽度 是 64 位 ， 是 Pentium 的 两 倍 。 在 
Pentium Pro 中 具有 容量 和 Pentium 相 同 、 每 片 8K 的 独立 片上 一 级 (LI1) 指令 和 数据 高 速 缓存 。 它 
还 有 一 个 容量 是 256K 的 二 级 (L2) 高 速 缓存 。 这 个 高 速 缓存 在 处 理 器 芯片 的 同一 个 包 中 ， 但 是 
它 在 一 块 单独 的 芯片 上 通过 一 条 64 位 总 线 和 处 理 器 芯片 相连 。 

处 理 器 中 的 多 指令 单元 支持 超标 量 操作 ， 包 括 两 个 整 型 运算 和 两 个 浮 点 运算 。Pentium Pro 性 
能 提高 的 主要 原因 是 它 可 以 用 不 同 的 顺序 执行 指令 ， 而 不 按照 存储 在 内 存 程序 中 指定 的 顺序 来 
执行 。 这 一 特点 使 得 它 可 以 将 更 多 的 指令 进行 并 行 处 理 。 当 然 这 样 做 必须 要 提供 相应 的 控制 来 
保证 程序 执行 的 计算 结果 是 正确 的 。 在 Pentium Pro 中 也 实现 了 动态 转移 预 判 功能 ， 这 与 Pentium 
相同 。 这 种 能 力 使 得 处 理 器 可 以 在 指令 流 中 具有 更 大 的 处 理 范围 ， 从 而 可 以 充分 利用 并 行 处 理 。 

外 部 总 线 检测 线路 使 得 Pentium Pro 适 用 于 多 处 理 器 系统 。 这 些 检测 线路 是 用 来 设置 和 保持 存 
储 在 不 同 处 理 器 高 速 缓存 中 共享 数据 的 一 致 性 的 ， 并 在 适当 的 时 候 采 取 相应 的 控制 动作 (参见 
第 12 章 “高 速 缓存 一 致 性 ”部 分 的 描述 )。 


11.3.6 Pentium li 和 Pentium III 处 理 器 


Pentium I 处 理 器 增加 了 在 3.23.2 节 中 描述 的 MMX 指 令 。 这 种 指令 可 以 很 方便 地 并 行 处 理 多 
媒体 中 用 像素 来 表示 图 形 的 这 种 较 短 数据 。 通 常 ， 这 些 数据 采用 8 个 相同 的 保存 浮 点 数 的 64 位 寄 
存 器 来 进行 存储 。Pentium II 中 L1 级 高 速 缓存 的 容量 是 Pentium Pro 中 L1 级 高 速 缓存 容量 的 两 倍 ， 
每 个 高 速 缓存 的 容量 是 16K。 片 外 的 L2 级 高 速 缓存 的 容量 是 512K。 

Pentium HI 处 理 器 引入 了 在 3.23.3 节 中 介绍 的 向 量 (SIMD) 指令 。 这 些 指 令 ， 称 为 数据 流 
SIMD 扩 展 (SSE) 指令 "m， 用 于 高 效 处 理 操作 数 是 浮 点 数 的 向 量 操作 ， 四 个 32 位 的 浮 点 操作 数 
被 分 别 打包 装 入 到 八 个 新 的 128 位 寄存 器 中 ， 这 些 寄 存 器 称 为 XMM 寄 存 器 。 高 速 缓存 中 除 带 有 
一 个 额外 的 选项 之 外 ， 其 他 都 与 Pentium HHA]. Pentium 处理 器 的 一 个 版 本 在 相同 的 芯片 上 有 
256K 的 L2 级 高 速 缓存 ， 它 可 以 为 L1 级 高 速 缓存 提供 更 高 带宽 的 通道 

在 Pentium、Pentium Pro, Pentium H. Pentium II 处 理 器 分 别 于 1993 年 、1995 年 、 1997 年 和 
1999 年 问世 时 ， 它 们 的 时 钟 频率 分 别 是 60、200、266 和 500MHz。 随 着 电路 技术 和 VLSI 制造 技术 
的 提高 ， 并 进一步 减 小 了 晶体 管 的 体积 和 门 电路 的 延迟 ， 在 Pentium II 处 理 器 目前 版 本 中 其 时 钟 
频率 可 以 达到 1GHz。 


11.3.7 Pentium 4 处 理 器 


2000 年 问世 的 Pentium 4 最 初版 本 的 时 钟 频率 为 1.3~1.5 GHZ, 它 支持 全 部 IA-32 指 令 集 以 及 
MMX 和 SSE 指 令 。SSE 指 令 已 经 扩展 成 为 SSE2， 能 处 理 两 包 64 位 浮 点 数 或 128 位 寄存 器 中 的 两 包 
64 位 整 型 。 在 实现 数据 安全 应 用 中 的 加 密 和 解密 操作 时 ， 长 整 型 发 挥 了 很 大 的 作用 。Pentium 4 
中 的 流水 线 更 深 一 一 相对 于 Pentium II 中 的 10 段 而 言 已 经 达到 了 20 段 一 -为 了 达到 更 高 的 时 钟 频 
率 ， 它 采用 了 更 短 的 段 ， 同 时 还 改善 了 电路 和 制造 技术 。 

Pentium 4 处 理 器 有 两 个 独立 的 L1 级 的 数据 和 指令 高 速 缓 在。 数据 高 速 缓存 的 容量 是 8K ， 用 4 
路 组 相 联 装置 可 以 访问 64 字 池 高 速 缓存 块 。 指令 高 速 缓存 组 织 成 可 以 保存 已 经 解码 的 指令 执行 
路 径 段 ， 称 为 跟踪 ， 它 可 以 扩展 原 程序 中 的 多 条 转移 。 如 果 路 径 是 重复 的 ， 那么 执行 速度 更 快 。 
当然 ， 当 跟踪 重复 时 必须 检查 所 选择 的 转移 是 否 相同 。 术语 跟踪 高 速 丝 存 是 用 来 描述 这 种 跟踪 
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策略 的 。 解 码 后 的 指令 通常 表示 成 微 操 作 。 读 足 四 条 微 操 作 就 将 它们 表示 成 一 条 IA-32 指 令 。 跟 
踪 高 速 缓存 可 以 保存 很 多 执行 路 径 段 ， 这 些 段 总 共 由 12K 微 操作 构成 。 

256K 字 节 的 片上 L2 高 速 缓存 设计 成 128 字 节 块 和 8 路 组 相 联 装 置 。L2 和 L1 级 高 速 缓 存 之 闽 的 
传输 路 径 支持 的 传输 速率 是 48GB/s， 在 Pentium II 中 只 有 16GBhs。 

Pentium 4 中 的 系统 总 线 比 Pentium II 中 总 线 提供 了 更 高 的 传输 率 。Pentium 4 的 系统 总 线 是 64 
位 宽 ， 可 以 在 400MHz 时 进行 传输 ， 因 此 传输 率 是 3.2GBs， 而 在 Pentium II 中 只 有 1GBAs。 


11.3.8 AMD 公 司 的 IA-32 处 理 器 


除 Intelj 公 司 外 ， 其 他 公司 也 生产 实现 了 IA-32 体 系 结构 的 处 理 器 ， 目 的 是 为 了 在 个 人 计算 机 
和 工作 站 上 与 Intel 公 司 的 相应 产品 进行 竞争 。AMD 公 司 62 曾经 一 段 时 间 就 曾 如 此 。 在 2000 年 ， 
AMD 的 Athlon 处 理 器 就 可 以 达到 时 钟 频率 为 1.2GHz， 在 性 能 上 是 与 Pentium4 相 当 的 产品 。 

Athlon 是 在 处 理 器 芯片 上 采用 两 级 的 缓存 技术 。L1 级 的 高 速 缓存 容量 是 128K，L2 级 高 速 组 
存 的 容量 是 256K。 一 个 双 倍 速率 的 DRAM 内 存 (参见 第 5 章 ) 的 接口 可 以 提供 最 高 的 传输 率 是 
2.1GBA。 系 统 MO 总 线 协 议 可 以 在 200MHz 和 266MHz 下 工作 。 


11.4 PowerPC 系列 


在 20 世 纪 90 年 代 早 期 IBM、Motorola 和 侠 果 公司 为 了 面向 个 人 计算 机 和 工作 站 市 场 共同 合 
作 开 发 了 RISC 型 处 理 器 系列 PowerPC03. 四。 由 IBM 和 Motorolal!5] 合作 生产 的 PowerPC 处 理 器 被 应 
用 在 IBM 和 蕴 果 计算 机 上 。 通 常 ， 这 些 处 理 器 具备 的 体系 结构 特征 与 Intel IA-32 处 理 器 所 提供 的 
计算 能 力 相当 。 第 一 台 实现 PowerPC 体 系 结构 的 处 理 器 是 1993 年 生产 的 601。 首 先 我 们 总 体 看 一 
下 该 系列 指令 集 的 体系 结构 ， 之 后 再 描述 其 中 一 些 处 理 器 的 实现 。 


11.41 寄存 器 集 


该 处 理 器 中 有 32 个 通用 寄存 器 和 32 个 浮 点 寄存 器 。 浮 点 寄存 器 的 宽度 是 64 位 ， 采 用 IEEE 标 
准 表示 浮 点 数 。PowerPC 体 系 结构 定义 了 32 位 和 64 位 的 操作 模式 。 通 用 寄存 器 的 大 小 由 特定 处 理 
器 的 实现 模式 来 决定 。 


11.4.2 存储 器 导 址 方式 


存储 器 是 按照 字 节 寻 址 的 ， 并 且 只 使 用 Load 和 Store 两 条 指令 在 存储 器 和 处 理 器 寄存 器 之 间 
进行 数据 的 传输 。 为 了 保持 RISC 的 设计 类 型 ， 只 采用 了 简单 的 变 址 寻 址 方式 。 有 效 地 址 通过 在 
基 址 寄存 器 中 的 内 容 加 上 变 址 产生 ， 变 址 可 以 是 指令 中 的 立即 数 或 是 在 基 址 寄存 器 中 的 内 容 。 
作为 可 选 操作 ， 有 效 地 址 可 以 写 人 基 址 寄存 器 中 。 这 就 使 得 在 连续 的 内 存 地 址 中 可 以 很 方便 地 
读 写 操作 数 序列 。 在 传送 乘法 操作 数 时 可 以 使 用 单 指令 。Load 和 Store 指 令 有 很 多 版 本 ， 在 传送 
不 同类 型 和 大 小 的 操作 数 时 提供 了 很 大 的 灵活 性 。 


11.43 指令 


PowerPC 指 令 长 度 是 32 位 的 固定 格式 。 算 术 和 逻辑 指令 使 用 3 寄存 器 格式 ， 两 个 操作 数 寄存 
器 和 一 个 用 来 保存 结果 的 目标 寄存 器 。 还 提供 了 大 量 的 条 件 转移 指令 。PowerPC 中 提供 了 “ 乘 加 ” 
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指令 ， 对 保存 在 寄存 器 RA、RB 和 RC 中 的 浮 点 数 进行 以 下 操作 : 
RD ~ ([RA] x [RB]) + [RC] 

其 中 的 一 类 条 件 转移 指令 对 计数 器 减 1 然后 再 转移 ， 但 减 1 操 作 是 否 执行 要 看 计数 器 中 的 值 是 否 
减 到 0。 乘 加 操作 、 减 1 转移 、 多 个 操作 数 的 传送 指令 和 在 变 址 寻 址 中 可 选择 的 修改 基 址 寄存 器 
操作 都 是 典型 RISC ISA 中 的 特点 。 这 四 个 特点 分 别 在 终止 循环 、 进 入 和 退出 程序 时 保存 和 恢复 
处 理 器 寄存 器 以 及 处 理 表 中 的 数据 项 中 都 是 非常 有 效 的 。PowerPC 的 设计 者 在 综合 这 些 特点 时 
采用 了 适当 的 折 表 ,保留 了 高 效率 、 简 单 的 数据 流 和 流水 线 指令 ， 这 都 是 RISC 机 器 中 的 基本 特 
点 。 应 该 注意 的 是 所 有 的 这 些 特征 中 ， 除 了 减 1 转 移 操 作 外 ， 其 他 的 在 ARM ISA 中 都 存在 相同 的 
形式 。 


11.4.4 POwerPC 处 理 器 


在 IBM 的 系列 产品 中 ，PowerPC 体 系 结构 的 计算 机 继承 了 使 用 [BM 精简 指令 集 系统 (RS) 
/6000 系 列 处 理 器 的 POWER 体 系 结构 。 率先 实现 PowerPC 体 系 结构 的 601 处 理 器 是 两 种 体系 结构 
之 间 的 过 渡 产 品 ; 同样 ， 它 实现 了 POWER 和 PowerPC 指 令 集 的 全 部 内 容 。 这 样 ， 601 就 可 以 同时 
编译 POWER 程序 和 PowerPC 程 序 。 在 系列 中 的 后 续 处 理 器 就 是 纯粹 的 PowerPC 处 理 器 了 。 

PowerPC 601 处 理 器 

601 处 理 器 芯片 包含 280 万 个 晶体 管 ， 它 最 先 应 用 于 IBM 台 式 机 中 。 601 是 一 个 32 位 处 理 器 ， 
主要 面向 笔记 本 、 台 式 计算 机 和 低 端 多 处 理 器 系统 。 相应 不 同 版 本 的 处 理 器 的 时 钟 频率 分 别 有 
50MHz、66MHz、80MHz 和 100MHz。 

PowerPC 601 的 处 理 器 芯片 上 有 一 个 用 来 存储 指令 和 数据 的 32K 高 速 缓 在。 高速 缓存 设计 成 8 
路 的 组 相 联 装置 。 它 提供 三 个 独立 的 执行 单元 : 一 个 整 型 单元 、 一 个 浮 点 单元 和 一 个 转移 处 理 
单元 。 为 了 达到 超标 量 运算 能 力 ， 一 个 时 钟 周 期 内 可 以 发 出 三 条 指令 。 601 中 的 整 型 指令 有 四 个 
流水 线 阶 段 ， 浮 点 指令 有 六 个 流水 线 阶段 。 

PowerPC 603 处 理 器 

603 处 理 器 的 处 理 宽度 也 是 32 位 。 它 主 要 面向 笔记 本 和 台式 计算 机 ， 是 低 成 本 、 低 功 耗 处 理 
器 ， 在 80MHz 时 的 功率 是 3 瓦特 。 它 提供 的 五 个 独立 执行 单元 可 以 并 行 处 理 ， 每 个 时 钟 周期 发 出 
三 条 指令 ， 所 以 指令 发 布 和 控制 硬件 相应 要 比 601 复 杂 。 芯片 上 的 高 速 缓存 分 成 两 个 8K 字 节 的 单 
独 部 分 ， 分 别 用 来 存储 指令 和 数据 。 

PowerPC 604 处 理 器 

604 处 理 器 也 是 32 位 的 ， 它 的 性 能 要 比 601 和 603 都 高 ， 其 中 整 型 和 浮 点 的 运算 速度 是 601 和 
603 的 两 倍 。604 处 理 器 的 性 能 已 经 达到 时 钟 频率 100MHz、 每 个 时 钟 周期 内 能 发 出 四 条 指令 的 超 
标量 能 力 。 处 理 器 中 有 六 个 独立 处 理 单元 : 三 个 整 型 单元 、 一 个 浮 点 单元 、 一 个 存储 器 读 / 写 单 
元 和 一 个 转移 处 理 单元 。 这 种 处 理 器 主要 面向 个 人 计算 机 和 中 等 规模 的 工作 站 。 

PowerPC 620 处 理 器 

620 处 理 器 实现 了 完全 64 位 PowerPC 体 系 结构 并 具有 超标 量 的 性 能 。 它 主要 面向 高 档 的 台式 
计算 机 、 服 务 器 、 事 务 处 理 系统 和 多 处 理 器 系统 。 

与 604 相 同 ，620 有 六 个 单独 的 执行 单元 ， 一 个 时 钟 周期 内 能 执行 四 条 指令 。 由 于 处 理 器 可 
以 乱 序 执行 指令 ， 特定 程序 中 指令 执行 的 实际 效率 会 大 大 提高 。 该 处 理 器 采用 了 动态 转移 预 判 





断 的 技术 ， 处 理 器 芯片 包含 指令 高 速 缓存 和 数据 高 速 缓存 。 每 个 高 速 缓存 容量 是 32K， 并 采用 8 
路 组 相 联 装置 。 

MPC7450 处 理 器 

601、603、604 和 620 是 由 IBM 生 产 的 第 一 批 PowerPC 系 列 产品 。 在 6XX 系 列 之 后 ，Motorola 
实现 了 7XX 和 7XXX 的 PowerPC 处 理 器 ， 并 冠 以 前 级 MPC。 在 MPC7XXX 系 列 中 最 新 的 处 理 器 是 
2001 年 年 初 问世 的 MPC7450， 它 的 时 钟 频 率 达 到 733MHz。 该 款 处 理 器 用 在 Apple Power Mac G4 
系列 计算 机 中 。 

MPC7450 是 7 段 流水 线 的 超标 量 处 理 器 。 一 个 时 钟 周期 内 能 将 四 条 指令 发 送 到 功能 单元 中 。 
这 样 的 功能 单元 共有 十 一 个 : 一 个 读 / 写 单元 ， 一 个 转移 单元 ， 四 个 整 型 单元 ， 一 个 浮 点 单元 ， 
还 有 四 个 单元 用 来 执行 打包 向 量 数据 操作 数 的 并 行 算术 运算 。Motorola 对 这 些 后 面 的 单元 都 用 
AltiVecLI6 命名 。 

AltiVec 硬 件 对 向 量 操作 数 进行 并 行 处 理 ， 这 与 Intel Pentium 处 理 器 进行 MMX 和 SSE 操 作 是 相 
同 的 ， 就 像 我 们 在 3.23.2 和 11.3.6 节 中 描述 的 那样 。AltiVec 指 令 所 操作 的 打包 数据 存储 在 32 个 128 
位 的 向 量 寄 存 器 中 ， 这 些 寄存 器 与 通用 寄存 器 和 浮 点 寄存 器 是 独立 的 。 一 个 向 量 寄存 器 可 以 存 
储 16 个 8 位 整数 、8 个 16 位 整数 、4 个 32 位 整数 或 4 个 单 精度 (32 位) 浮 点 数 。 向 量 的 Load 和 Store 
指令 用 来 在 内 存 和 向 量 寄存 器 之 间 传 送 数 据 。AltiVec 指 令 加 速 了 多 媒体 和 信号 处 理 操 作 。 指 令 
中 有 一 条 是 乘法 累积 指令 ， 用 来 将 两 个 向 量 寄存 器 中 的 对 应 元 素 相 乘 之 后 ， 再 将 结果 和 第 三 个 
向 量 寄存 器 中 对 应 的 元 素 相 加 。 这 种 操作 在 数字 信号 处 理 中 是 非常 普遍 的 。 另 外 ， 该 处 理 器 中 
还 包含 向 量 点 乘积 指令 。 

片上 的 L1 级 高 速 缓存 组 成 了 独立 的 32K 指 令 和 数据 高 速 缓 存 。 这 些 高 速 组 存 采用 8 路 组 相 联 
装置 。L2 级 高 速 缓 存 也 在 片上 ， 其 容量 是 256K ， 采 用 8 路 组 相 联 装置 。 在 处 理 器 的 时 钟 频率 下 ， 
L1 和 L2 级 高 速 缓存 之 间 的 数据 传送 宽度 是 256 位 。 片 外 的 L3 级 高 速 缓存 通过 64 位 总 线 进 行 访问 ， 
它 可 以 配置 的 容量 是 1M 或 2M。 


11.5 _ Sun 公司 SPARC 系 列 


由 Sun 公司 开发 的 SPARC 体 系 结构 是 一 个 可 升级 的 体系 结构 。 它 由 一 系列 性 能 逐渐 提高 的 处 
理 器 来 实现 技术 和 组 织 上 的 创新 发 展 。 基 本 指令 集 的 体系 结构 保持 不 变 。SPARC 处 理 器 针对 高 
性 能 的 工作 站 和 服务 器 ， 主 要 用 于 处 理 器 内 存 共 享 的 多 处 理 器 系统 中 。 我 们 将 在 第 12 章 介绍 这 
类 系统 。 

SPARC 体 系 结构 是 使 用 3 寄存 器 、32 位 固定 长 度 指 令 格式 的 RISC 型 体系 结构 。 在 指令 中 指定 
两 个 源 操作 数 寄存 器 和 一 个 旭 标 寄存 器 。 所 有 对 数据 进行 运算 的 指令 操作 都 是 在 处 理 器 的 寄存 
器 中 完成 的 。 处 理 器 中 有 32 个 通用 整 型 和 地 址 寄存 器 ，32 个 浮 点 操作 数 寄 存 器 。 可 以 访问 内 存 
的 指令 是 Load 和 Store 指 令 ， 主 要 用 来 在 内 存 和 寄存 器 之 间 进 行 数据 的 传送 。 

SPARC 体 系 结构 于 1987 年 首次 实现 ， 它 有 32 位 地 址 和 32 位 数据 。 该 体系 结构 的 最 新 版 本 是 
版 本 9， 它 处 理 的 地 址 和 数据 宽度 都 是 64 位 ， 由 UltraSPARC 系 列 处 理 器 实现 。 指 令 宽度 还 是 32 位 ， 
所 有 寄存 器 的 编程 模式 保持 不 变 。 它 保持 向 后 兼容 性 ， 也 就 是 说 ，UltraSPARC 处 理 器 能 执行 早 
期 版 本 体系 结构 的 机 器 代码 。 

我 们 在 第 8 章 中 引入 SPARC 体 系 结构 。 这 里 用 UltraSPARC 处 理 器 来 说 明 在 高 性 能 处 理 器 中 怎 
样 实现 流水 线 功能 。UltraSPARC 系 列 中 包括 UltraSPARC I、I、IIE， 其 特点 是 多 处 理 单 元 和 超标 
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量 性 能 。 除 了 基本 的 SPARC 指 令 集 以 外 ， 又 引入 了 很 多 特殊 的 指令 来 支持 图 形 和 多 媒体 的 应 用 。 
这 些 称 为 可 视 化 指令 集 (VIS)。VIS 指 令 提 供 了 对 图 形 像素 或 数字 信号 样本 打包 成 64 位 字 的 异 行 
向 量 操作 数 。VIS 指 令 与 Intej 的 MMX 和 SSE 指 令 (第 3 章 部 分 HI 和 第 11.3.6 节 ) 及 Motorola AltiVec 
(第 11.4.4 节 ) 指令 很 相似 。UltraSPARC 系 列 中 的 后 续 成 员 逐 浙 提 高 了 性 能 ， 即 具有 更 高 的 时 钟 
频率 、 更 快 的 内 存 和 VO 接口 以 及 更 大 和 更 加 复杂 的 高 速 缓存 结构 。 例 如 ，UItraSPARC I 采用 0.5 微 
米 的 CMOS 技 术 ， 时 钟 频率 是 167MHz ("7。 它 的 后 续 产 品 UktraSPARC 0， 同 样 包括 9 段 流水 线 结 
构 ， 但 由 于 采用 了 更 快 的 0.25 微 米 的 技术 08 而 使 性 能 进一步 提高 ， 其 运行 的 时 钟 频率 在 230MHz 
到 480MHz 之 间 。 

最 新 的 系列 成 员 UltraSPARC II， 采 用 14 段 的 流水 线 结 构 H%l 。 处 理 器 中 有 四 个 整 型 执行 单元 
和 三 个 浮 点 单元 ， 还 可 以 处 理 VIS 指 令 。UltraSPARC II 采用 0.18 微 米 的 制造 技术 ， 时 钟 频率 在 
750MHz 到 900MHz 之 间 ， 今 后 可 以 制造 时 钟 频率 为 1.5GHz 的 处 理 器 。 片 上 的 L1 数 据 高 速 缓存 的 
容量 是 64K， 指 令 高 速 缓存 的 容量 是 32K。 它 们 都 是 4 路 组 相 联 装置 ， 并 对 32 字 节 的 块 进行 操作 。 
外 部 的 L2 级 高 速 缓 存 采 用 直接 映射 的 方法 ， 可 以 配置 的 容量 是 4M 或 8M。UltraSPARC II 还 支持 
多 处 理 器 配置 ， 同 时 具有 连接 几 百 个 处 理 器 的 潜力 。 

microSPARC 系列 

另 一 个 基于 SPARC 体 系 结构 的 处 理 器 系列 称 为 microSPARC。 这 个 系列 中 的 成 员 是 基于 
SPARC 体 系 结构 说 明 书 中 的 版 本 8 开发 的 32 位 处 理 器 。 该 处 理 器 主要 针对 低 成 本 单 处 理 器 的 应 用 。 
该 系列 成 员 中 的 某 些 处 理 器 ， 如 microSPARCITep， 还 包括 一 个 处 理 器 片上 的 PCI 楼 口 和 存储 器 挖 
制 器 ， 很 适用 于 嵌入 式 应 用 。 这 些微 处 理 器 与 UltraSPARC 处 理 器 的 完全 兼容 性 为 开发 供 人 式 的 
应 用 提供 了 很 大 的 便利 。 这 样 一 个 特定 的 应 用 软件 可 以 在 功能 强大 的 工作 站 上 开发 和 测试 ， 然 
后 在 开发 的 最 后 阶段 将 软件 下 载 到 目标 处 理 器 中 。 


11.6 康 柏 ALPHA 系 列 


DEC 公司 在 1992 年 推出 的 Alpha 体 系 结构 是 32 位 VAX 系 列 Co 的 后 续 产 品 。 康 柏 公司 在 1998 年 
收购 了 DEC 公司 。 该 公司 采用 Alipha 处 理 器 生产 了 一 系列 高 档 工作 站 和 服务 器 系统 ， 并 用 序号 
21X64 来 标注 ，X=0、1 和 2。 

Alpha 体 系 结构 采用 地 址 和 数据 宽度 都 是 64 位 的 RISC 设 计 。 它 有 32 个 通用 寄存 器 和 32 个 浮 点 
寄存 器 。 在 所 有 的 21X64 处 理 器 中 都 采用 了 多 流水 线 处 理 单元 ， 以 达到 超标 量 指令 的 执行 效率 和 
提高 静态 和 动态 转移 预 判 断 的 处 理 能 力 。 它 使 用 了 片上 的 独立 数据 和 指令 高 速 缓存 。 

流水 线 处 理 器 设计 的 基本 目标 是 在 给 定 任何 一 种 实现 技术 和 较 高 的 时 钟 频率 条 件 下 ， 尽 可 
能 保持 每 个 流水 线 有 较 短 的 逻辑 深度 ， 以 此 来 减 小 阶段 闻 的 延迟 。Alpha 体 系 结构 最 重要 的 设计 
特点 是 使 用 简单 的 指令 格式 和 寻 址 方式 ， 以 达到 缩短 流水 线段 之 间 的 延迟 。 为 了 使 Li 级 高 速 组 
存 和 处 理 器 之 间 的 数据 传送 延迟 达到 最 小 ， 只 采用 32 位 和 64 位 的 Load 和 Store 两 条 指令 。 


11.6.1 指令 和 导 址 方式 的 格式 


Alpha ISA 只 有 四 种 指令 类 型 ， 长 度 全 都 是 32 位 : 
操作 一 一 在 这 种 类 型 中 包括 整数 、 浮 点 数 和 字 节 操作 的 运算 。 这 些 指令 采用 三 操作 数 格式 ， 
两 个 操作 数 在 处 理 器 的 寄存 器 或 指令 的 立即 字段 中 。 


内 存 一 Load/Store 操 作 采 用 寄存 器 加 变 址 地 址 的 偏 移 量 作为 惟一 的 寻 址 方式 。 





转移 一 一 条 件 转移 指令 包含 一 个 偏 移 量 值 ， 该 值 用 来 指定 方向 和 与 程序 计数 器 相关 的 转移 目 
标 地 址 的 距离 。 这 里 没有 条 件 码 寄存 器 ， 条 件 代码 通过 操作 指令 可 选 地 写 到 通用 寄存 器 中 。 该 
寄存 器 由 需要 测试 代码 的 转移 指令 进行 命名 。 无 条 件 转移 指令 用 命名 的 寄存 器 来 保存 修改 的 程 
序 计数 器 的 值 ， 以 便 在 转移 程序 是 子 程序 调用 时 将 该 值 作为 返回 地 址 。 

调用 PAL 一 一 特权 体系 结构 库 (Privileged Architecture Library, PAL) 指令 执行 在 用 户 模式 下 
不 可 见 的 操作 系统 功能 。 这 些 特权 指令 可 以 访问 那些 普通 指令 集 不 能 访问 的 硬件 资源 ， 即 处 理 
器 状态 寄存 器 。PAL 程 序 还 包含 一 些 在 Alpha 指 令 集 中 不 存在 的 指令 。 它 们 主要 用 于 中 断 和 对 存 
储 器 管理 单元 的 寄存 器 进行 操作 。 


11.6.2 ALPHA 21064 处 理 嚣 


Alpha 体 系 结构 最 先是 由 21064 实 现 的 ， 它 是 有 170 万 个 晶体 管 、 功 率 为 30 瓦 、 时 钟 频 率 为 
200MHz 的 芯片 外， 有 8K 字 节 的 指令 和 数据 LI 级 高 速 缓 存 。 两 个 高 速 缓存 都 是 直接 映射 的 32 字 节 
块 。 外 部 的 L2 级 高 速 缓存 可 以 配置 的 容量 是 128K 到 3M 字 节 。 存 健 器 管理 单元 有 单独 的 转换 监视 
缓冲 区 来 监控 指令 (12 入口 ) 和 数据 (32 人 口 ) 的 访问 。 

每 个 时 钟 周期 内 最 多 发 出 两 条 指令 ， 使 用 四 个 独立 的 处 理 单元 : 一 个 整 型 单元 、 一 个 浮 点 
型 单元 、 一 个 转移 单元 以 及 一 个 存储 器 读 / 写 单元 。 四 个 单元 的 流水 线 深度 分 别 是 7、10、6 和 7。 
前 四 个 段 是 公用 的 ， 可 以 并 行 处 理 两 条 指令 。 


11.6.3 ALPHA 2116443888 


21164 处 理 器 在 1994 年 推出 3。 它 的 性 能 是 最 初 21064 处 理 器 的 两 倍 。21164 中 的 晶体 管 数量 
达到 了 930 万 个 ， 在 时 钟 频率 是 300MHz 时 的 功率 为 50 瓦 。 提 供 片 上 统一 的 96K 的 L2 级 高 速 缓存 以 
及 8K 的 L1 级 指令 和 数据 高 速 缓存 。L2 级 高 速 绥 存 是 3 路 组 相 联 装置 ， 并 有 64 字 节 的 块 。 片 外 的 
L3 级 高 速 缓存 可 配置 的 容量 是 IM 到 64M 字 节 。 

每 个 时 钟 周 期 内 最 多 发 出 四 条 指令 ， 是 21064 的 两 倍 。21164 比 21064 多 了 一 个 用 来 管理 L2 和 
L3 级 高 速 缓存 的 功能 单元 。 两 者 的 流水 线 深度 相同 。 存 储 器 管理 硬件 设置 了 一 个 48 人 日 的 转换 
监视 缓冲 区 来 访问 指令 ， 以 及 一 个 64 入 日 的 缓冲 区 来 访问 数据 。 


11.6.4 ALPHA 21264 处 理 器 


21264 是 21X64 系 列 p4 中 最 新 的 处 理 器 。 它 是 在 1998 年 推出 的 ， 时 钟 频率 为 900MHz。 在 
2001 年 年 初 ， 运 行 的 版 本 已 经 达到 了 850MHz。 处 理 器 芯片 中 有 1500 万 个 晶体 管 。 

与 早期 的 Alpha 处 理 器 相 比 ， 高 速 缓存 方案 有 了 非常 大 的 改变 。L1 指 令 和 数据 高 速 缓存 比 以 
前 大 很 多 ， 每 个 都 是 64K， 都 是 2 路 的 组 相 联 装置 。 片 外 统一 的 L2 级 高 速 姐 存 可 以 配置 的 容量 是 
1M 到 16M。21264 没 有 L3 级 高 速 缓 在。 由 于 有 了 更 大 的 L1 级 高 速 缓存 ， 从 而 增加 了 命中 率 ， 这 
样 即 使 L2 级 高 速 缓存 是 片 外 的 ， 也 会 使 存储 器 的 访问 延迟 整体 减少 。 

21264 和 早期 Alpha 处 理 器 的 另 一 个 重要 的 不 同 之 处 在 于 ， 它 可 以 将 指令 乱 序 发 送 到 功能 单元 
中 ， 就 像 第 8 章 中 讨论 的 那样 。 这 对 于 典型 程序 可 以 增强 它 超 标量 指令 的 执行 效率 。 每 个 上 时钟 周 
期 内 发 出 四 条 指令 ， 这 与 21164 中 的 相同 。 但 是 由 于 对 整 型 和 浮 点 单元 中 部 分 内 容 的 复制 导致 了 
功能 单元 资源 的 增加 ， 同 时 还 增加 了 一 个 新 的 功能 单元 来 处 理 视频 数据 。 这 一 -指令 执行 硬件 的 
提高 ， 再 配合 更 高 的 时 钟 频率 和 乱 序 发 布 指令 的 能 力 ， 使 得 它 的 性 能 比 21164 提 高 了 两 倍 。 


A 
~ 
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11.7 Intel IA-64 系 列 


从 20 世 纪 90 年 代 中 期 开始 ，Intel 和 Hewlett-Packard 联 合 开发 了 64 位 被 称 为 IA-64 35 的 微 处 理 
器 体系 结构 。 最 早 实现 该 体系 结构 的 处 理 器 是 Itanium (更 早 的 代号 是 Merced )。IA-64 体 系 结构 
与 IA-32 体 系 结构 完全 不 同 ， 它 采用 Intel 的 体系 结构 ， 支 持 以 前 的 80386 以 及 持续 发 展 的 Pentium 
系列 处 理 器 。Intel 希 望 一 直 都 生产 IA-32 和 IA-64 体 系 结构 兼容 的 处 理 器 。IA-64 体 系 结构 的 编程 特 
点 在 参考 文献 [26] 和 [27] 中 有 详细 描述 。 

IA-64 体 系 结构 有 64 位 的 地 址 空间 和 64 位 的 整 型 和 浮 点 格式 ， 类 似 于 RISC 的 3 寄存 器 指令 格 
式 占 41 位 。 该 结构 为 128 个 通用 寄存 器 或 128 个 浮 点 寄存 器 寻 址 提供 了 三 个 7 位 的 寄存 器 域 。 下 面 
将 介绍 一 个 6 位 域 指定 指令 的 条 件 执行 。 指 令 中 剩 下 的 14 位 用 来 指定 OP 码 。 


11.7.1 指令 包 


IA-64 体 系 结构 中 的 一 个 显著 特征 是 ， 三 个 41 位 的 指令 再 加 上 5 位 称 作为 模板 的 域 组 成 了 一 个 
128 位 的 包 (bundle)。 模 板 用 来 说 明 怎样 由 编译 器 指定 对 指令 进行 并 行 处 理 的 信息 。 例 如 ， 有 一 
个 模板 代码 指定 了 一 个 停止 位 ， 这 就 表示 在 该 组 指令 结束 时 可 以 进行 并 行 处 理 。 这 样 的 组 可 以 
扩展 很 多 的 指令 包 。 模 板 中 的 信息 是 处 理 器 用 来 对 多 功能 单元 中 的 指令 进行 调度 以 便 并 行 处 理 ， 
从 而 实现 超标 量 的 操作 。IA-64 的 这 个 特点 称 为 式 并 行 指令 计算 (EPIC)。EPIC 可 以 认为 是 对 超 
长 指令 字 〈(VLIW ) 指令 集 设计 名 的 一 种 扩展 。VLIW 体 系 结构 中 ， 每 条 指令 指定 一 些 可 能 的 不 
同 操作 ， 这 些 操作 可 以 用 在 并 行 独立 的 数据 操作 中 。 


11.7.2 条 件 执行 


IA-64 体 系 结构 中 的 一 个 主要 特征 是 在 指令 中 使 用 条 件 执行 ， 称 为 预 判 。 每 条 指令 中 64 位 
的 预 判 域 是 从 处 理 器 64 个 1 位 预 判 标志 中 选择 的 。 这 些 标志 有 效 地 代替 了 传统 处 理 器 中 的 条 件 
代码 标志 。 如 果 名 为 fag 的 值 是 1 则 指令 执行 ; 否则 ， 该 指令 不 执行 。 实 际 上 ， 指 令 是 通过 指令 
流水 线 来 执行 的 ， 如 果 预 判 标志 是 1 时 才 将 结果 写 到 目标 寄存 器 中 。 这 个 特点 很 像 在 ARM 体 系 
结构 中 指令 的 条 件 执行 ， 我 们 在 第 3 章 的 部 分 I 中 描述 过 。 

指令 的 条 件 执行 通过 将 条 件 转移 转移 到 某 个 特 








定 的 位 置 上 ， 以 达到 提高 程序 指令 执行 的 效率 。 例 BE o 
如 ， 一 条 简短 的 前 向 条 件 转移 通过 执行 它 的 条 件 代 | THEN: Add 
码 ， 删 除 该 条 件 转移 不 成 立时 的 位 置 到 其 目标 位 置 ge ROERI Rs 
之 间 的 代码 。 代 码 块 中 保护 每 条 指令 执行 的 预 判 标 
志 通 过 提前 对 该 代码 块 进行 测试 和 比较 来 设置 。 a) 传统 的 代码 
在 生成 IA-64 代 码 中 的 一 个 then-else 结 构 时 也 Gomme P2PI L RIRA. 
可 以 进行 性 能 改善 。 图 11-3a 给 出 了 在 传统 的 机 器 代 (P1) Add R3,R4,R5 
码 中 ， 如 果 寄存 器 R1 和 R2 的 内 容 相等 就 执行 加 法 指 | CP Subtract RORTRS G 
令 ， 如 果 不 相等 则 执行 减法 指令 。 在 图 11-3b 中 给 出 
了 相应 的 IA-64 代 码 。IA-64 比 较 相等 指令 的 操作 过 b) 1A-64 代码 


程 如 下 : 如 果 R1 和 R2 的 内 容 相 等 ， 预 判 标志 P1 就 是 ”图 11-3 在 IA-64 体 系 结构 中 实现 if-then-else 代 码 
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1; 否则 ， 预 判 标志 P1 是 0。 标 志 P2 是 对 P1I 的 补充 。 如 果 P1=1， 执 行 加 法 指令 ; 如 果 P2=1， 执 行 
减法 指令 。 双 分 号 表示 停止 位 置 。 在 此 例 中 ， 两 个 双 分 号 之 闻 的 加 法 和 减法 指令 可 以 进行 并 行 
调度 处 理 。 由 Pl1 和 P2 的 值 来 决定 哪个 操作 的 结果 将 写 到 指定 的 目标 寄存 器 中 。 在 加 法 指令 和 减 
法 指令 到 达 写 阶段 之 前 ，P1 和 P2 的 值 还 未 确定 ， 那 么 指令 执行 流水 线 不 会 装 和 人 新 的 指令 。 

除了 采用 这 类 提高 性 能 的 技术 以 外 ，IA-64 还 采用 了 第 8 章 讨论 过 的 转移 预 判 和 推测 性 执行 。 


11.7.3 推测 性 装 入 


为 了 减少 由 寄存 器 访问 内 存 装 入 指令 而 带 来 的 延迟 ， 引 入 了 一 种 称 为 推测 性 装 入 
(speculative load) 的 特殊 形式 的 装 入 指令 ， 它 可 以 由 编译 器 自动 生成 。 该 装 和 人 通常 放 在 被 编译 程 
序 的 前 面 位 置 。 这 样 做 增加 了 当 需 要 该 指令 时 它 在 寄存 器 中 的 机 会 ， 从 而 避免 了 相应 访问 内 存 
的 时 间 延 迟 。 但 如 果 我 们 使 用 该 指令 ， 必 须 首 先 检查 它 确实 在 寄存 器 中 。 在 处 理 推 独 性 装 和 的 
指令 是 需要 提前 传送 的 预 判 转 移 指令 时 ， 要 给 予 特殊 的 考虑 。 


11.7.4 寄存 器 和 寄存 器 堆栈 


IA-64 体 系 结构 中 指定 了 128 个 通用 寄存 器 来 存储 64 位 的 整数 或 地 址 ， 此 外 还 有 128 个 用 来 保 
FDR (GH) 浮 点 数 的 寄存 器 。 两 个 单 精度 数 可 以 打包 存在 一 个 寄存 器 中 。 还 有 8 个 用 来 保 
存 子 程序 calyretum 的 连接 地 址 的 64 位 寄存 器 。 

通用 寄存 器 中 的 前 32 个 RO 到 R31 供 一 般 的 数据 和 地 址 使 用 。 剩 下 的 96 个 寄存 器 R32 到 R127 作 
为 寄存 器 堆栈 使 用 ， 用 来 保存 子 程序 的 局 部 变量 ， 以 及 在 调用 程序 和 子 程序 之 间 传 递 参 数 。 这 
个 寄存 器 堆栈 有 效 地 代替 了 处 理 器 的 堆栈 ， 并 且 是 在 内 存 中 实现 的 ， 这 在 2.9.1 节 中 描述 过 。 该 
寄存 器 堆栈 的 管理 方式 是 ， 寄 存 器 不 必 向 内 存 或 从 内 存 中 保存 /恢复 一 系列 供 套 子 程序 的 调用 ， 
它 具体 的 工作 流程 描述 如 下 : 首先 假定 所 有 子 程序 所 需要 的 全 部 和 局 部 参数 变量 的 寄存 器 空间 
不 超过 96。 在 发 生子 程序 调用 时 ， 处 理 器 控制 硬件 自动 从 寄存 器 堆栈 中 “ 拿 出 ”一 部 分 到 内 存 
中 ,创建 所 需 的 额外 寄存 器 空间 。 当 子 程序 返回 时 ， 会 自动 将 这 部 分 空间 归还 给 寄存 器 堆栈 。 

处 理 器 还 自动 进行 寄存 器 的 重 命 名 ， 这 样 所 有 的 程序 一 一 主 程序 和 子 程序 尽管 所 用 的 物理 寄 
存 器 不 同 ， 但 总 是 能 指向 它们 自己 局 部 的 R32 以 上 号 码 的 寄存 器 《寄存 器 重 命名 的 另 一 版 本 在 第 
8 章 中 讨论 过 )。 调 用 程序 的 局 部 寄存 器 的 高 地 址 部 分 和 被 调 程序 局 部 寄存 器 的 低地 址 部 分 是 重 
八 区 域 ， 该 区 域 用 来 实现 参数 的 传递 。 

图 11-4 给 出 了 当主 程序 调用 一 个 子 程序 时 如 何 管理 寄存 器 堆栈 。 图 中 给 出 的 堆栈 寄存 器 的 序 
号 是 向 上 递增 的 。 这 样 容易 与 第 2 章 所 举 的 堆栈 (堆栈 增加 的 方向 是 内 存 地 址 减 小 的 方向 ) 例子 
进行 比较 。 寄存 器 RO 到 R31 是 所 有 程序 都 可 见 的 ,可 以 用 来 保存 全 局 变量 , 但 是 在 图 中 没有 给 出 。 
假定 主 程序 使 用 从 R32 到 R39 的 八 个 寄存 器 存储 它 的 局 部 变量 ， 用 R40 到 R43 的 四 个 寄存 器 来 为 子 
程序 传递 参数 。 通 过 在 主 程序 中 的 如 下 指令 来 向 处 理 器 硬件 声明 寄存 器 的 使 用 : 

Alloc 8,4 
图 11-4a 中 给 出 了 它 的 状态 。 在 主 程 序 调用 子 程序 之 后 ， 子 程序 执行 指令 : 
Alloc 7,3 


用 来 声明 它 需 要 七 个 局 部 寄存 器 ， 四 个 用 来 接收 从 调用 程序 传送 来 的 参数 ， 三 个 用 来 为 第 二 个 
子 程序 传递 参数 。 处 理 器 硬件 对 十 个 (物理 的 ) 寄存 器 R40 到 R49 进 行 重新 映射 ， 使 得 它们 可 以 
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和 子 程序 的 R32 到 R41 寄存 器 相对 应 。 在 执行 子 程序 时 活动 的 寄存 器 堆栈 部 分 如 图 11-4b 所 示 。 执 
行 时 动态 映射 所 需 的 信息 是 在 主 程序 中 执行 Alloc 指 令 时 的 值 给 出 的 。 当 子 程序 执行 返回 主 程序 
时 ， 寄 存 器 堆栈 的 活动 部 分 就 恢复 到 图 11-4a 中 所 示 的 状态 。 寄 存 器 堆栈 实现 了 一 个 多 寄存 器 窗 
口 的 版 本 ， 这 一 点 在 伯克利 RISC 设 计 ? 2 和 UltraSPARC I 处理 器 中 所 采用 (参见 第 8 章 )。 





入 


b) 执行 完 Alloc 7, 3 之 后 子 程序 中 的 活动 寄存 器 区 域 
图 11-4 IA-64 中 为 局 部 变量 和 参数 传递 分 配 的 寄存 器 堆栈 


另 一 种 寄存 器 重 命名 的 形式 称 为 寄存 器 循环 ， 在 IA-64 中 采用 。 它 假定 在 重复 的 数据 之 间 没 
有 数据 依赖 性 的 限制 ， 用 来 重复 执行 循环 的 逐次 迭代 。 通 常 ， 一 个 Loop 循 环 中 连续 重复 使 用 相 
同 的 寄存 器 ， 这 些 寄 存 器 是 在 循环 体 中 进行 命名 的 。 在 IA-64 体 系 结构 中 ， 编 译 器 为 循环 体 生成 
一 个 副本 ， 该 副本 人 允许 硬件 自动 重 命名 寄存 器 ， 以 便 在 循环 连续 的 重复 部 分 中 使 用 不 同 的 物理 
寄存 器 。 这 样 就 允许 指令 调度 和 执行 硬件 在 前 面 的 重复 还 没 结 束 时 就 开始 这 次 连续 的 重复 部 分 





操作 。 这 项 技术 降低 了 整个 循环 的 执行 时 间 ， 被 称 为 软件 流水 线 。 它 不 同 于 循环 展开 ， 在 循环 
展开 中 复制 的 循环 体 副本 是 使 用 机 器 指令 代码 来 赫 代 的 。 


11.7.5 Itanium 处 理 器 


Itanium 是 最 先 实现 [A-64 体 系 结构 34 的 处 理 器 。 它 提供 了 更 多 的 复制 功能 单元 给 不 同类 型 的 
操作 : 整 型 、 浮 点 、 多 媒体 (类似 于 IA-32 体 系 结构 中 的 MMX 操 作 ， 在 第 3 章 部 分 I 中 描述 过 )。 
在 时 钟 周期 是 800MHz 了 时 可 以 向 10 段 流水 线 发 出 六 条 (两 个 3 指令 包 ) 超标 量 的 指令 。 它 的 功能 
单元 有 : 4 个 整 型 单元 、4 个 浮 点 单元 、4 个 多 媒体 (MMX) 单元、2 个 读 / 写 单 元 和 3 个 转移 单元 。 
整 型 寄存 器 为 能 与 多 功能 单元 同时 交换 数据 ， 在 边沿 上 设 有 8 个 读 口 和 6 个 写 口 。 

处 理 器 中 有 三 级 高 速 绥 存单 元 。L1 和 L2 高 速 缓存 和 处 理 器 在 同一 块 芯片 上 ，L3 在 单独 芯片 
上 ， 不 过 这 个 芯片 和 处 理 器 封装 在 同一 个 包装 中 。L1 级 高 速 缓存 由 单独 的 每 个 容量 是 16K 字 节 的 
指令 和 数据 高 速 缓存 构成 。 它 们 是 4 路 组 相 联 装置 ， 有 32 字 节 的 块 。 指 令 高 速 缓存 能 在 每 个 时 钟 
周期 内 向 处 理 器 传送 两 条 3 指令 包 (256 位 )。L2 高 速 缓存 容量 是 96K 字 节 ， 它 是 6 路 组 相 联 装置 ， 
有 64 字 节 块 。L3 级 高 速 缓存 的 总 容量 是 4M 字 节 ， 带 64 字 节 块 。 它 是 4 路 组 相 联 装置 ， 通 过 一 条 
128 位 的 内 部 总 线 与 L2 级 高 速 缓 存 相 连 ， 在 处 理 器 时 钟 频率 下 的 传输 速率 是 12.8GB/s。 

在 高 速 缓存 之 间 以 及 L1 级 高 速 缓存 和 处 理 器 之 间 的 交互 ， 是 在 将 平均 指令 执行 速率 下 高 速 
缓存 失败 和 处 理 器 流水 线 延 迟 碱 到 最 小 的 条 件 下 进行 的 。 这 些 交 互 中 的 一 些 特征 是 值得 关注 的 。 
ELI 级 指令 高 速 缓存 和 处 理 器 之 间 有 个 解 耦 缓冲 区 ， 它 可 以 容纳 八 个 3 指令 包 。 这 就 允许 在 处 理 
器 发 送 指令 的 延迟 期 间 可 以 从 L1 级 高 速 缓存 向 缓冲 区 连续 预 取 指令 。 相 反 ， 当 高 速 缓 存在 预 取 
的 过 程 中 失败 时 ， 处 理 器 可 以 继续 从 缓冲 区 读 取 或 发 出 指令 。 在 LI 和 L2 级 高 速 缓存 之 间 也 有 一 
个 缓冲 区 用 于 L2 从 LI1 预 取 指 令 。 这 个 缓冲 区 的 大 小 是 L1 级 高 速 缓存 和 处 理 器 指令 发 布 硬件 之 间 
缓冲 区 的 两 倍 。LI1 级 高 速 缓存 只 处 理 整 型 寄存 器 ， 浮 点 操作 数 直 接 从 L2 级 高 速 缓存 装 入 浮 点 寄 
存 器 中 。 

处 理 器 中 有 一 个 64 位 的 系统 总 线 用 来 连接 包 ， 该 包 中 包含 处 理 器 和 高 速 缓存 到 其 他 系统 部 
件 如 主 存 和 WO 设备 的 连接 。 它 支持 266MHz 的 传输 速率 ， 也 就 是 2.1GB/s。 

外 部 总 线 控制 器 提供 将 四 个 Itanium 处 理 器 直接 连接 到 一 个 多 处 理 器 的 结构 。 当 多 处 理 器 共 
享 外 部 存储 器 单元 时 ， 挖 制 器 处 理 所 需 高 速 缓存 一 致 性 的 操作 。 这 些 将 在 第 12 章 中 介绍 。 


11.8 堆栈 处 理 器 


本 书 中 所 讨论 的 所 有 处 理 器 都 是 采用 通用 寄存 器 保存 操作 数 的 。 指 令 可 以 按照 任意 的 顺序 
访问 它们 。 几 年 前 ，Hewlett-Packard (WH) 公司 设计 制造 了 一 台 名 为 HP3000 的 计算 机 ， 它 主要 
的 体系 结构 特征 是 有 一 套 特别 的 指令 ， 该 指令 处 理 的 操作 数 是 保存 在 堆栈 数据 结构 中 的 。 访 问 
堆栈 中 的 操作 数 要 求 只 能 对 栈 项 的 数据 进行 操作 ， 操 作 结果 总 是 保存 到 栈 顶 。 这 种 类 型 的 设计 
不 适合 于 当前 高 度 并 行 的 RISC 和 CISC 处 理 器 。 在 这 些 处 理 器 中 ， 当 许多 寄存 器 中 同时 访问 几 个 
操作 数 时 要 求 有 很 高 的 性 能 。 然 而 ，HP3000 和 更 早 由 Burroughs 公 司 成 产 的 B5500、B6500 和 
B6700 系 列 计算 机 也 是 面向 堆栈 处 理 的 ， 作 为 堆栈 式 计算 机 的 商品 其 共有 重要 的 历史 意义 。 这 些 
机 器 处 理 算术 表达 式 的 方式 既 有 趣 又 巧妙 。 我 们 通过 描述 HP3000 指 令 集 和 和 寻 址 方式 来 说 明 它 的 
主要 思想 。 讨 论 主 要 集中 在 这 种 计算 机 堆栈 组 织 结构 的 特点 上 。 
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11.8.1 堆栈 结构 


HP3000 是 16 位 计算 机 。 程 序 中 的 指令 和 数据 在 内 存 中 是 分 开 存放 的 ; 而 对 于 使 用 立即 数 
的 程序 来 说 ， 指 令 和 数据 是 不 可 混淆 的 概念 。 硬 件 寄存 器 用 作 程序 和 数据 段 的 指针 ， 如 图 11-5 
所 示 。 


数据 段 





r==7- 
| qis 堆栈 指针 SP) 


图 11-5 HP3000 中 的 程序 和 数据 段 结构 


程序 中 的 段 用 三 个 寄存 器 来 指定 。 程 序 基 址 (PB) 和 程序 界限 (PL) 寄存 器 表示 程序 所 占 
内 存 空间 的 大 小 ， 程 序 计 数 器 (PC) 指向 当前 正在 执行 的 指令 。 每 一 个 寄存 器 都 使 用 16 位 的 地 
址 。 

数据 段 被 分 成 两 个 部 分 一 一 堆栈 和 数据 区 。 五 个 16 位 指针 用 来 表示 和 访问 这 些 内 存单 元 。 数 
据 基 址 (DB) 寄存 器 的 内 容 表示 堆栈 区 域 的 起 始 地 址 。 堆 栈 向 高 地 址 的 方向 增长 。 如 果 堆 栈 的 
栈 顶 元 素 在 位 置 ?， 那 么 下 一 个 进 栈 元 素 的 位 置 将 是 + 1。 这 一 点 和 本 书 中 讨论 的 其 他 堆栈 方式 
正好 相反 ， 以 前 的 堆栈 是 假定 堆栈 增长 方向 是 向 内 存 地 址 减 小 的 方向 。 堆 栈 顶端 元 素 的 地 址 又 
称 栈 顶 〈TOS)， 存 铺 在 16 位 的 堆栈 指针 (SP) 中 。SP 实 际 上 并 不 是 像 我 们 简单 说 明 的 那样 是 一 
个 单一 的 硬件 寄存 器 ， 但 是 也 可 以 这 样 考 虑 。 它 会 随 着 数据 元 素 的 压 栈 或 弹出 而 增 减 。 从 用 户 
的 角度 来 看 ， 它 的 功能 和 其 他 的 16 位 指针 寄存 器 相同 。 堆 栈 的 上 限 由 堆栈 界限 (SL) 寄存 器 的 
内 容 指定 。 因 此 ， 堆 栈 可 以 一 直 增长 ， 直 到 [SP] = [SL]。 硬 件 会 阻止 任何 试图 使 堆栈 超过 由 DB 
和 SL 所 定义 的 界限 的 操作 。 数 据 区 的 范围 是 从 DB 寄存 器 中 指定 的 位 置 到 数据 界限 (DL) 寄存 器 
中 指定 的 界限 。 

指针 寄存 器 说 明了 堆栈 当前 的 大 小 、 最 大 容量 和 在 内 存 中 的 位 置 。 这 样 堆栈 就 是 一 个 很 容 
易 变化 的 动态 结构 。 图 11-5 给 出 了 另 一 个 堆栈 指针 一 一 堆栈 标志 (Q) 寄存 器 。 这 个 寄存 器 表示 
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当前 程序 的 数据 堆栈 的 开始 位 置 。 实 际 上 ，Q 指 向 堆栈 四 字 入 口中 的 第 四 个 字 ， 称 为 堆栈 标志 ， 
它 是 为 了 便于 在 程序 之 间 进 行 转换 控制 而 设置 的 。Q 寄 存 器 的 角色 和 在 第 2 章 中 描述 的 帧 指针 寄 
存 器 很 相似 。 当 一 个 程序 必须 挂 起 时 ， 比 如 产生 了 中 断 ， 那 么 正确 返回 到 该 挂 起 程序 所 需 的 信 
息 将 以 堆栈 标志 的 形式 保存 到 堆栈 当中 。 

堆栈 标志 的 第 一 个 字 保 存 的 是 变 址 寄存 器 的 当前 内 容 ， 第 二 个 字 保 存 返 回 地 址 。 实 际 保存 
的 返回 地 址 信息 与 PC 的 值 及 PB 寄存 器 中 的 内 容 不 同 ，PC 中 的 值 是 指向 当前 程序 要 执行 的 下 一 条 
指令 。 由 于 存储 的 是 偏 移 量 而 不 是 绝对 地 址 值 ， 所 以 程序 可 以 移出 这 个 存储 器 以 外 ， 之 后 返回 
到 这 个 内 存 中 的 其 他 地 方 。 通 过 在 PB 寄存 器 中 装 入 新 值 来 指向 内 存 中 的 一 个 新 区 域 。 第 三 个 字 
保存 的 是 状态 寄存 器 中 的 状态 信息 ， 第 四 个 字 保 存 的 是 该 堆栈 标志 和 它 紧 挨 着 的 前 一 个 堆栈 标 
志 的 距离 。 

图 11-6 给 出 一 个 堆栈 标志 ， 表 示 为 k， 在 Procedure 初始 化 时 放 入 堆栈 ; 另 一 个 堆栈 标志 ， 表 
示 为 k+1， 当 Procedureuw 初始 化 时 放 入 堆栈 。 当 这 个 新 程序 完成 时 ， 机 器 通过 堆栈 标志 +1 中 的 
数据 将 控制 权 交 给 先前 的 程序 。 那 时 ，Q 寄 存 器 必须 设置 指向 堆栈 标志 的 第 四 个 字 。 因 为 在 每 
个 标志 中 都 存储 了 堆栈 标志 之 间 的 距离 ， 所 以 这 很 容易 实现 。 同 时 ，SP 也 要 设置 指向 堆栈 标志 
K+1 的 先前 程序 的 位 置 。 结 果 ，SP 指 向 的 是 Procedure; 所 用 的 栈 顶 ， 这 样 ， 就 恢复 了 在 调用 
Rrocedurew 时 的 退出 状态 。 这 种 技术 可 以 用 在 循环 伐 套 的 程序 中 。 程 序 之 间 的 参数 传递 也 是 采用 
堆栈 来 完成 的 。 








堆栈 标志 上 









Procedure 使 
用 和 /或 生成 
的 数据 


返回 地 址 (与 PB 有 关 ) 
示 志 kk+1 
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与 前 面 Q 的 距离 (AQ) 





Procedure k+l 


图 11-6 HP3000 中 的 堆栈 标志 
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除了 指针 寄存 器 以 外 ，HP3000 计 算 机 在 机 器 内 部 结构 中 还 使 用 了 其 他 的 硬件 寄存 器 。 只 有 
两 个 寄存 器 程序 员 可 见 ， 即 变 址 寄存 器 和 状态 寄存 器 ， 它 们 的 功能 本 质 上 和 大 多 数 计 算 机 中 同 
名 的 寄存 器 是 相同 的 。 然 而 注意 ， 这 里 没有 给 程序 员 使 用 的 通用 寄存 器 。 相 反 ， 用 堆栈 操作 的 
数据 是 临时 存储 的 ， 我 们 在 下 一 节 中 用 例子 进行 说 明 。 


11.8.2 堆栈 指令 


作为 一 种 基本 策略 ， 堆 栈 计算 机 是 在 栈 顶 有 限 的 空间 内 对 数据 进行 操作 的 ， 而 且 产生 的 结 
果 还 要 保存 在 堆栈 中 。 这 就 要 求 有 可 以 在 堆栈 和 内 存 之 间 传 送 数据 的 指令 。 

HP3000 有 各 种 指令 ， 它 们 都 是 16 位 。 大 多 数 的 指令 在 某 种 方式 上 包括 堆栈 和 典型 的 操作 数 、 
操作 地 址 ， 或 者 是 其 他 保存 在 堆栈 中 的 相关 参数 。HP3000 有 13 类 主要 指令 。 我 们 不 描述 整个 
HP3000 指 令 集 ， 而 是 把 重点 放 在 机 器 的 堆栈 结构 上 。 首 先 来 考虑 存储 器 地 址 指令 ， 其 格式 在 图 
11-7 中 给 出 。 





方式 bo bs b; bs bs bs bs b, b, bo 


有 效 内 存 地 址 
PC + relative 
PC — relative 
DB + relative 
Q+ relative 


[PC]+ D 
[PC]~ D 
IDB]+ D 
[Q]-D 
[Q]-D 
[SP]-D 


Q- relative 





SP — relative 





图 11-7 HP3000 中 内 存 寻 址 指令 格式 


5 位 操作 码 字段 的 11 个 标量 用 来 指定 这 类 指令 。 存 储 器 地 址 指令 包括 : 

LOAD ”将 一 个 指定 的 内 存 字 压 栈 。 

STOR ”将 栈 顶 字 弹 出 ， 放 入 指定 的 内 存单 元 中 。 

ADDM 将 指定 的 内 存 字 和 栈 顶 相 加 ， 并 将 栈 顶 改 成 相 加 的 和 。 

MPYM 将 指定 的 内 存 字 和 栈 顶 相 乘 ， 并 将 栈 顶 改 为 乘积 中 最 重要 的 字 。 

INCM _ 将 指定 的 内 存 字 加 1。 

这 些 指令 采用 特定 的 寻 址 方式 来 指定 内 存 中 的 操作 数 ， 操 作 数 的 地 址 放 在 相应 的 寻 址 方式 
所 使 用 的 PC、DB 、Q 或 SP 寄存 器 中 。10 位 方式 和 偏 移 字段 分 别 用 来 表示 采用 的 寻 址 方式 和 相应 
的 偏 移 量 ， 如 图 中 所 示 。 因 为 偏 移 字段 是 从 6 位 到 8 位 可 变 ， 所 以 所 有 的 寻 址 方式 可 以 采用 不 同 
长 度 的 偏 移 量 。 变 址 位 和 间接 位 表示 是 否 使 用 了 变 址 寻 址 或 间接 寻 址 。 它们 是 图 11-5 中 用 来 访问 
数据 区 操作 数 仅 有 的 两 种 寻 址 方式 。 





第 二 类 指令 是 传送 指令 ， 使 用 一 到 两 个 内 存 操作 数 。 这 些 指令 可 以 在 内 存 中 传送 字 ( 字 节 )、 
比较 两 个 字 节 串 或 扫描 一 个 字 节 串 直到 找到 特定 的 值 为 止 。 内 存 地 址 可 以 在 相应 的 寻 址 方式 中 
重新 计算 。 偏 移 量 在 指令 中 并 没有 明确 给 出 ， 而 是 以 数据 的 形式 保存 在 堆栈 中 。 此 外 ， 只 能 遂 
过 相关 的 程序 或 数据 的 基 址 ， 也 就 是 PB 或 DB 寄存 器 中 的 内 容 来 指定 地 址 。 这 类 指令 中 的 一 个 典 
型 的 例子 是 基本 的 MOVE 指 令 ， 它 在 内 存 中 将 k 个 字 从 一 个 位 置 移 到 另 一 位 置 中 ， 其 中 : 

第 一 个 堆栈 元 素 TOS 指 定 。 

. 堆栈 的 第 一 个 元 素 给 出 与 PB 或 DB 相关 的 第 一 个 源 内 存单 元 的 地 址 。 

* 堆栈 的 第 三 个 元 素 给 出 与 DB 相关 的 第 一 个 目标 内 存单 元 的 地 址 。 

由 于 该 指令 的 大 部 分 寻 址 数据 和 参数 长 度 都 是 隐 含 在 堆栈 的 指定 位 置 上 的 ， 因 此 它 可 以 表 
示 成 16 位 代码 .但 在 指令 执行 之 前 这 些 数 据 必须 装 到 堆栈 中 。 

下 面 我 们 讨论 堆栈 指令 ， 其 格式 由 图 11-8 给 出 。 这 类 指令 采用 最 高 位 是 四 个 0 来 区 别 。 剩 下 
的 12 位 用 来 说 明 特 定 的 指令 ， 并 且 这 12 位 被 分 成 两 个 6 位 bona ， ， 
的 域 ， 每 个 域 用 来 指定 一 个 目标 操作 。6 位 长 度 一 共 可 以 — -一 一 一 
定义 64 个 不 同 的 堆栈 操作 。 这 个 数字 已 经 足够 容纳 各 种 | 
堆栈 操作 了 。 一 条 指令 用 10 位 ( 主 操 作 码 加 上 堆栈 操作 
码 A) 来 指定 一 个 堆栈 操作 ， 剩 下 的 6 位 不 考虑 。 当 用 剩 pm ， 作 mA 
余 的 位 来 指定 第 二 个 堆栈 操作 (使 用 堆栈 操作 码 B) 的 时 
候 ， 它 要 在 第 一 个 操作 完成 后 才 执 行 。 这 样 ， 两 条 堆栈 
操作 可 以 打包 成 一 条 单 指令 。 因 为 寻 址 数据 和 操作 数 不 作 为 指令 的 一 部 分 包括 在 其 中 ， 所 以 可 
以 有 效 地 利用 指令 代码 空间 。 

一 些 堆 栈 指 令 实 例如 下 : 

ADD ”将 栈 顶 的 两 个 字 相 加 ， 并 把 这 两 个 元 素 删除 ， 然 后 将 相 加 的 和 放 入 栈 顶 。 

CMP 将 栈 顶 的 两 个 字 进 行 比较 ， 设 置 完 相应 的 条 件 码 之 后 将 这 两 个 字 删 除 。 

DV ”用 栈 顶 整数 字 除 堆栈 的 第 二 个 整数 字 ， 用 商 替换 第 二 个 字 ， 余 数 替换 栈 顶 。 

DEL ”删除 栈 顶 字 。 

堆栈 指令 集中 提供 了 很 多 的 指令 ， 尽 管 有 些 指令 是 非常 复杂 的 。 例 如 ， 长 除 指令 (DIVL) 
用 栈 顶 元 素来 除 以 第 二 和 第 三 个 元 素 构 成 的 双 字 整数 。 之 后 删除 这 三 个 元 素 ， 分 别 将 余数 和 商 
作为 栈 顶 元 素 和 第 二 个 元 素 放 入 栈 中 。 我 们 在 这 里 讨论 堆栈 指令 时 比较 宽松 地 使 用 了 “指令 ” 
这 个 术语 ， 因 为 加 法 操作 和 除法 操作 可 以 在 一 条 指令 中 指定 。 当 描述 这 样 的 操作 时 更 习惯 用 指 
令 作为 术语 ， 而 且 这 也 和 先前 描述 的 将 两 条 指令 打包 成 一 条 指令 的 技术 相对 应 。 只 有 执行 两 个 
连续 的 堆栈 操作 时 才能 将 其 打包 。 在 其 他 情况 下 ， 操 作 码 B 是 不 使 用 的 。 

迄今 为 止 ， 我 们 只 强 i 
减少 了 内 存 的 访问 次 数 ， 因 为 两 条 指令 可 以 作为 一 个 16 位 字 进行 有 效 的 读 取 。 必 须 记 住 ， 在 执 
行 堆栈 指令 期 间 必须 访问 堆栈 中 的 操作 数 。 如 果 堆 栈 是 在 内 存 中 ， 就 需要 进行 内 存 的 访问 了 。 

为 了 说 明 堆栈 在 算术 运算 中 的 作用 是 用 来 临时 保存 计算 的 中 间 结 果 的 ， 我 们 来 看 一 个 简单 
的 例子 。 图 11-9 给 出 算术 表达 式 





堆栈 操 堆栈 操 


作 码 B 
图 11-8 HP3000 中 堆栈 指令 格式 





=— (a+b 
c/d+(ex f)/(g+h) 
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是 如 何 进行 计算 的 。 我 们 假定 变量 oa, b, …, h 不 在 栈 顶 。 它 们 保存 在 内 存 地 址 为 A, B, … H 的 区 域 
中 ， 并 可 以 通过 图 11-7 给 出 的 寻 址 机 制 进行 访问 。 此 外 ， 假 定 所 有 操作 数 只 是 单字 长 整数 。 图 中 
给 出 了 所 需 的 13 步 操作 。 所 需 的 操作 是 按照 表达 式 从 左 到 右 ， 先 分 子 再 分 母 的 顺序 进行 的 。 使 
用 的 符号 中 栈 顶 元 素 (TOS) ARAS. XH, RE S~[S]+[B] 的 含义 是 栈 顶 元 素 和 操作 数 B 相 
加 ， 并 用 相 加 的 和 代替 原 栈 顶 元 素 。 操作 S ~ [S-1]/[S] 表示 堆栈 的 第 二 个 元 素 被 栈 顶 元 素 除 ， 并 
将 两 个 操作 数 从 栈 中 删除 ， 再 把 商 和 余数 放 入 栈 中 。 

HP3000 机 器 指令 需要 执行 图 中 所 示 的 必要 计算 。 其 功能 在 本 节 的 前 面 已 经 描述 过 。 除 了 除 
法 指令 以 外 ， 大 多 数 步 又 的 实现 采用 的 是 单 指令 操作 。DIV 指 令 分 别 用 商 和 余数 来 替换 被 除数 和 
除数 。 因 为 我 们 只 对 商 感 兴趣 ， 所 以 用 DEL 指令 将 余数 从 栈 中 删除 。 当 遇 到 两 个 连续 的 堆栈 指令 
时 ， 就 将 它们 合并 成 一 个 16 位 的 指令 。 所 有 的 中 间 结 果 都 保存 在 堆栈 上 。 图 11-9b 给 出 了 在 完成 
第 9 步 时 的 栈 顶 元 素 。 


执行 的 操作 


Se[A] 

Se [S] + [B] 
Se [C] 

S e [D] 

Se [S-1]/{S] 


S e [E] 

Se [S]x[F]} 
S e [G] 

S [S] +[H] 
Se [S-1]/[S] 


S<[S-1]+[S] 
S<[S-1]J/[S] 


W e- [S] 





b) 在 第 9 步 之 后 保存 在 堆栈 中 的 临时 结果 
图 11-9 在 处 理 表达 式 w = (a + bY[c / d + (ef )/(g + 月 ] 时 堆栈 的 使 用 
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11.8.3 堆栈 中 的 硬件 寄存 器 


计算 机 中 对 内 存单 元 的 访问 是 最 关键 的 时 间 制 约 因 素 之 一 。 从 内 存 中 读 取 一 个 操作 数 所 需 
要 的 时 间 要 长 于 在 处 理 器 的 寄存 器 中 进行 处 理 的 时 间 。 这 也 是 处 理 器 中 要 包括 通用 寄存 器 的 主 
要 原因 。 在 堆栈 计算 机 中 ， 通 用 寄存 器 的 临时 保存 功能 是 通过 堆栈 机 制 来 实现 的 。 如 果 堆 栈 是 
完全 在 内 存 中 实现 的 ， 由 于 所 有 临时 的 保存 场所 是 堆栈 的 一 部 分 ， 那 么 处 理 器 必须 频繁 地 访问 
内 存 。 

将 整个 堆栈 都 用 硬件 寄存 器 来 实现 ， 其 成 本 太 高 且 不 太 灵 活 。 不 过 可 以 对 全 寄存 器 或 全 存 
储 器 实现 堆栈 方法 进行 一 个 折 中 ， 即 将 大 部 分 的 堆栈 放 在 内 存 中 ， 而 将 栈 顶 的 几 个 元 素 保存 到 
处 理 器 的 硬件 寄存 器 中 。 这 样 ， 由 于 大 部 分 的 访问 只 涉及 栈 顶 的 几 个 元 素 并 且 只 需 在 寄存 器 和 
处 理 器 之 间 进 行 传送 ， 所 以 访问 堆栈 的 时 间 会 大 大 降低 。 在 HP3000 计 算 机 中 ， 用 四 个 寄存 器 来 
保存 四 个 栈 顶 元 素 。 

在 堆栈 中 包含 硬件 寄存 器 意味 着 真正 的 栈 顶 元 素 (TOS) 通常 是 寄存 器 中 的 一 个 。 这 就 表明 
SP 再 没有 必要 指向 一 个 内 存 区 域 。 为 了 能 在 任何 时 刻 都 掌握 栈 顶 元 素 所 处 的 位 置 ， 通 过 两 个 寄 
存 器 来 实现 SP 的 功能 。 用 一 个 16 位 的 内 存 堆栈 寄存 器 (SM) 来 存储 堆栈 当前 所 占 内 存 的 最 高 地 
址 。 用 一 个 3 位 的 寄存 器 (SR) 来 表示 硬件 寄存 器 中 当前 包含 的 栈 顶 元 素 的 个 数 ， 其 取 值 为 : 0， 
1，2，3 或 4。 因 此 ，[SP] 的 值 是 : 

[SP] = [SM] + [SR] 


这 个 值 就 等 于 将 所 有 堆栈 元 素 放 在 内 存 时 栈 顶 元 素 所 处 的 内 存 地 址 。 它 的 结构 在 图 11-10 中 有 说 
明 。 程 序 员 并 不 会 觉察 到 堆栈 中 硬件 寄存 器 的 存在 。 对 程序 员 而 言 ， 只 存在 一 个 指针 一 一 堆栈 指 
针 ， 即 SP。 















主 存 中 
3 位 16 位 的 堆栈 
SR | 内 存 中 堆栈 SM) | 
L. 
uA R 
[SP] = [SM] + [SR] 硬件 寄存 器 


图 11-10 HP3000 中 的 栈 顶 结构 


11.9 结束 语 


高 性 能 的 处 理 器 都 采用 了 片上 的 高 速 缓存 来 完成 指令 、 数 据 和 地 址 的 转换 操作 。 这 些 处 理 
器 都 有 多 重 独立 的 基于 流水 线 的 处 理 单元 ， 并 且 在 每 个 时 钟 周期 内 能 向 这 些 单元 发 出 一 条 以 上 
的 指令 ， 有 的 还 可 以 按照 乱 序 处 理 。 动 态 转移 预 判 和 推油 性 轮流 执行 程序 路 径 的 复杂 方法 ， 使 
得 通过 判断 的 方式 执行 指令 成 为 可 能 ， 这 样 就 提高 了 计算 机 的 总 体 性 能 。 这 些 特点 是 提高 程序 


o 





os 
t> 
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指令 执行 效率 的 基本 方法 ， 且 与 是 否 采用 RISC 或 CISC 设 计 方 法 来 实现 指令 集 和 寻 址 方式 无 关 。 
将 高 级 语言 程序 转化 成 高 效 机 器 语言 代码 的 优化 编译 器 也 是 提高 性 能 的 一 个 关键 因素 。 在 评估 
一 台 计 算 机 的 性 能 时 必须 要 考虑 很 多 因素 ， 正 如 在 第 1 章 中 讨论 的 那样 ， 标 准 化 的 基准 程序 通常 
是 为 了 评估 机 器 性 能 而 使 用 的 。 


习题 


11.1 ARM 指 令 (参见 第 3 章 部 分 I) 中 的 条 件 执行 与 IA-64 指 令 中 的 预 判 执行 之 间 有 何 关 系 ? 说 明 

11.2 ARM 指 令 中 16 位 的 Thumb 指 令 子 集 主 要 用 于 压缩 程序 编码 。 估 算 一 下 在 图 11-9 中 所 示 的 算 
术 表 达 式 需要 多 少 条 Thumb 指 令 。 假 定 Thumb 指 令 集中 有 一 条 合适 的 除法 指令 (实际 上 并 
不 是 这 样 的 )。 与 图 11-9a 中 的 HP3000 程 序 指令 数 相 比 ，Thumb 指 令 的 指令 数 是 多 少 ? 

11.3 讨论 Motorola 680X0 处 理 器 系列 与 Intel 80X86 处 理 器 系列 之 间 的 异同 点 。 从 最 初版 本 一 直到 
68040 和 80486 版 本 之 间 都 要 进行 比较 。 

11.4 在 68030 微 处 理 器 中 有 一 个 256 字 节 的 指令 高 速 缓存 和 一 个 256 字 节 的 数据 高 速 缓存 。 是 否 这 
样 就 一 定 比 只 有 一 个 512 字 节 的 指令 高 速 缓存 而 没有 数据 高 速 缓存 的 结构 好 呢 ? 两 者 的 优 缺 
点 各 是 什么 ”针对 只 有 一 个 统一 的 512 字 节 的 指令 和 数据 高 速 缓存 回答 同样 的 问题 。 

11.5 Intel IA-32 处 理 器 有 专门 用 于 MO 操作 的 指令 ， 如 同 第 3 章 部 分 II 中 描述 的 那样 。Motorola 
680X0 处 理 器 只 使 用 存储 器 瑞 射 HO ， 那 么 存储 器 映射 IO 相对 于 专用 IO 的 优 缺 点 是 什么 
呢 ? 

11.6 讨论 Motorola 680X0 和 Intel 80X86 处 理 器 中 相应 寻 址 方式 的 优点 。 应 特别 注意 在 每 种 处 理 器 
的 寻 址 方式 中 是 如 何 便于 程序 重 定位 、 堆 栈 的 实现 、 访 问 操作 数 表 以 及 字符 串 操 作 的 。 

11.7 在 11.3.1 节 中 介绍 了 IA-32 处 理 器 可 以 根据 所 采用 的 分 段 和 分 页 方法 ， 将 存储 器 划分 为 四 种 
不 同 的 组 织 方 式 。 对 四 种 可 能 的 方式 举 出 一 些 例子 来 说 明 相应 的 优点 。 

11.8 写 一 个 ARM、68000 或 IA-32 程 序 来 计算 图 11-9 中 的 算术 表达 式 。 程 序 中 所 需 的 机 器 指令 与 
图 中 给 出 的 数值 相 比如 何 ? 假 定 标准 的 ARM 指 令 集 中 有 一 条 合适 的 除法 指令 (实际 并 不 存 
在 )。 

11.9 在 Alpha 处 理 器 中 ， 只 有 32 位 和 64 位 的 Load 和 Store 指 令 是 在 高 速 缓存 和 处 理 器 之 间 直 接 使 
用 数据 通道 的 。 描 述 一 个 组 合 逻 辑 网 ， 该 网 能 够 利用 32 位 宽 的 数据 通道 将 任意 一 个 四 字 节 
的 数据 加 载 到 目标 路 径 中 的 低位 字 节 。 

11.10 对 IA-64 处 理 器 中 的 寄存 器 堆栈 操作 和 第 2 章 中 处 理 器 (内 存 ) 堆栈 操作 进行 比较 。 尤 其 要 
对 堆栈 指针 SP 和 IA-64 模 式 中 相对 应 的 帧 指针 FP 进 行 比较 。 

11.11 请 给 出 执行 用 于 管理 IA-64 寄 存 器 堆栈 的 指令 Alloc X,Y 时 所 需 硬件 的 一 般 性 描述 。 假 定 使 
用 小 的 寄存 器 和 加 法 器 。 它 们 是 如 何 使 用 的 ? 

11.12 Alpha 21264 处 理 器 的 高 速 缓存 方案 与 21164 有 很 大 的 不 同 。 为 什么 21264 的 方案 较 好 呢 ? 
也 就 是 说 ， 当 只 考虑 缓存 的 作用 时 ， 什 么 情况 下 用 21264 执 行程 序 的 速度 更 快 ? 

11.13 说 明 表 达 式 





w=d(bxo+(dxe)+ fxs] 
hxi 
在 HP3000 中 是 如 何 计算 的 。 
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11.14 


11.15 


在 HP3000 计 算 机 中 ，Procedure; 产 生 8 个 字数 据 DL,…, DIs, 并 存储 在 堆栈 中 。 当 这 些 字 放 到 
堆栈 之 后 ， 且 在 Procedure; 执行 之 前 ， 一 个 新 程序 Procedure' 被 调用 ， 它 产生 10 个 字数 据 
DJi, DJo， 也 存在 堆栈 中 。 之 后 ， 另 一 个 程序 Procedure' 被 调用 并 在 堆栈 中 放 人 3 个 字数 
据 。 请 画 出 此 时 栈 顶 元 素 的 内 容 。 
说 明 表 达 式 

w=(a+b)(c+d)+(dx e) 
分 别 在 HP3000、ARM、Motorola 68000 和 IA-32 计 算 机 中 是 如 何 进行 计算 的 。 变 量 w，a， 


b,c，d 和 e 的 值 存储 在 内 存 中 。 并 作 如 下 假定 : 地 址 是 不 连续 的 。 在 HP3000 中 用 DB+ 相 


11.16 
11.17 


关 模 式 的 直接 内 存 寻 址 。 在 Motorola 68000 和 IA-32 计 算 机 中 采用 绝对 /直接 内 存 寻 址 。 在 
ARM 计 算 机 中 采用 相对 寻 址 方式 。 所 有 乘积 都 是 单字 长 的 。 

在 执行 图 11-9 给 出 的 程序 时 所 占用 的 最 大 的 堆栈 数 是 多 少 ? 

在 习题 11.13 和 习题 11.15 中 ， 用 HP3000 程 序 重新 回答 习题 11.16 的 问题 。 
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: 第 12 章 


大 型 计算 机 系统 


本 章 目 标 


在 本 章 中 你 将 学 习 以 下 内 容 : 

* 由 多 处 理 器 或 多 计算 机 组 成 的 大 型 计算 机 系统 
* 实现 多 处 理 器 的 不 同 结构 

“互连网 络 和 LAN 

“。 多 处 理 器 中 的 存储 器 组 织 结构 

。 共 享 数据 的 高 速 缓存 一 致 性 

。 共 享 存储 器 和 消息 传递 范例 

。 多 处 理 器 系统 中 的 性 能 问题 


当 一 个 计算 机 应 用 程序 需要 在 一 定 的 时 间 内 进行 大 量 的 计算 时 ， 我 们 必须 使 用 具有 较 强 计 
算 能 力 的 计算 机 。 这 样 的 机 器 通常 称 为 巨型 计算 机 。 巨 型 计算 机 的 典型 应 用 包括 天 气 预报 、 建 
筑 设计 中 有 限 元 分 析 、 流 体 分 析 、 大 型 复杂 的 物理 系统 模拟 以 及 计算 机 辅助 设计 (CAD)。 在 前 
面 章节 中 没有 对 巨型 计算 机 进行 讨论 。 

我 们 可 以 用 快速 电路 技术 和 体系 结构 的 特性 ， 如 多 功能 单元 、 流 水 线 、 大 容量 的 高 速 缓存 
(cache)、 交 和 替 式 主 存 以 及 指令 与 数据 总 线 相 分 离 等 方式 设计 出 高 性 能 的 处 理 器 。 所 有 这 些 的 可 
能 性 一 直 都 处 于 探索 和 研究 中 ， 并 且 有 些 制 造 商 正在 努力 开发 用 于 工作 站 的 处 理 器 。 他 们 追求 
的 是 在 不 提高 成 本 的 情况 下 尽 可 能 提高 机 器 的 性 能 ， 而 且 已 经 取得 了 令 人 瞩目 的 成 果 一 一 目前 工 
作 站 的 性 能 要 胜 过 十 年 前 巨型 计算 机 的 性 能 。 

然而 ， 很 多 应 用 所 要 求 的 计算 要 远 远 超 过 工作 站 的 现 有 能 力 ， 对 超级 计算 能 力 的 要 求 仍然 
很 强烈 。 一 种 方法 是 制造 一 个 带 有 几 个 功能 强大 处 理 单元 的 巨型 计算 机 。 该 类 型 通常 是 通过 采 
用 快速 电路 技术 、 更 宽 的 通道 、 访 问 更 大 的 内 存 以 及 扩展 IO 能 力 来 实现 的 。 这 种 计算 机 需要 相 
当 大 的 能 源 和 昂贵 的 散热 方案 。 在 计算 型 需求 的 应 用 中 ， 巨 型 计算 机 需要 尽 可 能 高 效 地 处 理 数 
据 向 量 ， 这 里 向 重 是 指 一 个 数字 (TR) 的 线性 数组 。 操 作 通常 在 整个 向 量 上 执行 。 例 如 ， 一 
条 加 法 操作 可 以 生成 一 个 向 量 ， 该 向 量 是 由 两 个 64 位 的 向 量 的 逐个 元 素 相 加 得 到 的 。 同 样 ， 一 
条 单独 存储 器 访问 操作 可 以 控制 整个 向 量 在 主 存 和 处 理 器 寄存 器 之 间 进 行 数据 传送 。 如 果 应 用 
程序 有 助 于 向 量 处 理 ， 那 么 具有 向 量 体 系 结构 的 计算 机 就 会 显示 出 良好 的 性 能 。 这 类 巨型 计算 
机 已 经 由 一 些 公司 如 Cray (Cray-1，Y-MP 和 SV1)、Fujitsu (VP5000). Hitachi (SR8000) 和 
NEC (SX-5) 投放 到 市 场 中 。 此 类 机 器 的 主要 缺点 是 成 本 太 高 一 一 无 论 是 购买 价格 还 是 操作 与 维 
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护 成 本 都 是 非常 昂贵 的 。 

一 种 可 提供 超级 计算 能 力 并 且 具 有 吸引 力 的 方案 ， 是 在 工作 站 中 使 用 大 量 的 处 理 器 。 该 方 
案 可 以 通过 两 条 基本 途径 来 实现 。 第 一 种 是 构造 一 个 包含 有 有 效 高 带宽 媒介 的 机 器 ， 可 以 在 多 
个 处 理 器 、 存 储 模块 和 1/O 设 备 之 间 进 行 通信 。 这 样 的 机 器 通常 指 的 是 多 处 理 器 。 第 二 种 是 通过 
局 域 网 将 多 台 工 作 站 相互 连接 起 来 构成 一 个 系统 。 这 类 系统 通常 称 为 分 布 式 计算 机 系统 。 多 处 
理 器 和 分 布 式 计算 机 系统 有 很 多 相似 之 处 。 前 者 具有 很 高 的 性 能 但 价格 昂贵 ， 后 者 则 可 以 用 较 
低 成 本 通过 现代 计算 机 环境 获得 。 在 本 章 的 后 续 中 ， 我 们 将 讨论 这 些 类 型 的 显著 特点 。 它 们 以 
合理 的 开销 提供 很 强 的 计算 能 力 。 

使 用 多 处 理 器 构成 的 系统 其 高 性 能 可 以 通过 将 多 个 计算 并 行 处 理 而 获得 。 提 高 这 种 系统 使 
用 效率 的 难点 之 一 就 是 如 何 将 一 个 应 用 分 解 成 较 小 的 任务 ， 并 把 它们 分 配 到 单个 处 理 器 上 同时 
进行 处 理 。 划 分 这 些 任 务 并 使 之 能 够 在 多 个 处 理 器 中 调度 并 协调 执行 ， 这 通常 需要 很 复杂 的 软 
件 和 硬件 技术 。 我 们 在 本 章 的 后 面 讨论 这 些 内 容 。 


12.1 并 行 处 理 的 形式 


对 于 一 个 给 定 的 计算 任务 ， 将 其 中 的 某 些 部 分 进行 并 行 处 理 ， 通 常 有 很 多 的 处 理 方法 。 我 
们 在 前 面 一 些 章节 中 已 见 过 几 种 。 例 如 ， 在 IO 操作 的 处 理 中 大 多 数 计算 机 中 都 有 这 样 的 硬件 ， 
它们 可 以 在 VO 设备 和 主 存 之 间 进 行 直 按 存储 器 访问 (DMA)。 在 主 存 和 磁盘 之 间 ， 无 论 任何 一 
个 方向 上 的 数据 传送 都 可 以 在 DMA 控 制 器 的 控制 下 在 处 理 器 之 间 并 行 执行 。 

当 将 一 个 数据 块 从 磁盘 传送 到 主 存 时 ， 处 理 器 通过 向 DMA 控 制 器 发 送 指令 开始 传送 过 程 。 
当 控制 器 按照 时 钟 周期 发 送 所 需 的 数据 时 ， 处 理 器 可 以 执行 一 些 和 这 些 数据 传输 无 关 的 计算 。 


” 当 控 制 器 的 传输 完成 时 ， 它 向 处 理 器 发 送 一 个 中 断 请 求 信号 通知 处 理 器 所 需 的 数据 已 经 传送 到 


主 存 中 。 相 应 地 ， 处 理 器 就 可 以 切换 到 使 用 这 些 数据 的 计算 中 。 
这 个 简单 的 例子 说 明了 并 行 处 理 的 两 个 基本 特征 。 第 一 ， 整 个 任务 具有 这 样 的 特点 ， 它 的 
一 些 子 任务 是 可 以 在 不 同 的 硬件 部 件 上 并 行 完 成 的 。 在 本 例 中 ， 处 理 器 计算 和 1/O 传 输 可 以 通过 


处 理 器 和 DMA 控 制 器 并 行 执行 ， 第 二 ， 必 须 有 一 些 方法 来 启动 和 协调 并 行 活动 。 当 处 理 器 设置 


DMA 传 输 开始 后 可 以 继续 其 他 的 计算 。 当 传输 完成 时 ， 由 DMA 控 制 器 向 处 理 器 发 出 中 断 信号 以 
实现 两 者 之 间 的 动作 协调 ， 从 而 允许 处 理 器 开始 使 用 传送 过 来 的 数据 继续 进行 相应 的 计算 。 

前 面 的 例子 说 明了 只 包括 两 个 任务 的 简单 并 行 例子 。 一 般 来 说 ， 应 用 程序 中 有 大 量 的 计算 
可 以 进行 细 分 ， 从 而 能 够 进行 并 行 处 理 。 在 计算 机 中 有 -- 些 硬件 结构 是 用 来 支持 这 样 的 并 行 计 
算 的 。 


并 行 结构 分 类 


并 行 处 理 的 一 般 性 分 类 是 由 Flynntu 提出 的 。 在 这 个 分 类 中 ， 单 处 理 器 计算 机 系统 称 为 单 指 
令 流 单 数据 流 (SISD) 系统 。 处 理 器 执行 的 程序 组 成 单 指令 流 ， 它 操作 的 数据 项 序列 组 成 单数 
据 流 。 第 二 种 模式 中 ， 单 指令 流 广播 到 多 个 处 理 器 中 。 每 个 处 理 器 都 有 自己 的 数据 。 在 这 种 模 
式 中 ， 所 有 的 处 理 器 都 执行 同样 的 程序 但 操作 不 同 的 数据 ， 这 通常 称 为 单 指令 流 多 数据 流 
(SIMD) 系统 。 该 系统 中 ， 多 个 数据 流 是 按照 数据 项 访问 的 顺序 保存 在 每 个 单独 处 理 器 的 存储 
器 中 。 第 三 种 模式 包括 多 个 独立 的 处 理 器 ， 每 个 处 理 器 都 执行 不 同 的 程序 但 是 访问 它们 自己 的 
数据 。 这 样 的 机 器 称 为 多 指令 流 多 数据 流 (MIMD) 系统 。 第 四 种 模式 是 多 指令 流 单数 据 流 





(MISD) 系统 ， 在 这 个 系统 中 ， 不 同 的 处 理 器 对 公用 的 数据 进行 操作 ， 每 个 处 理 器 都 执行 不 同 
的 程序 。 这 种 计算 形式 在 实际 中 不 会 出 现 ， 所 以 在 此 不 做 讨论 。 

本 章 主要 讨论 MIMD 结 构 ， 一 般 来 讲 它 是 最 有 用 的 。 但 是 ,我 们 首先 简要 地 浏览 一 下 SIMD 
结构 ， 说 明 这 种 应 用 是 如 何 进 行 良好 匹配 的 。 


12.2 阵列 处 理 器 


并 行 处 理 中 的 SIMD 形 式 也 称 为 阵列 处 理 ， 它 是 并 行 处 理 研究 和 实现 的 最 初 形式 。 在 20 世纪 
70 年 代 早期 ， 一 种 名 为 ILLIAC-IVCI 的 系统 利用 这 种 方法 在 Illinois 大 学 设计 成 功 ， 后 来 由 
Burroughs 公 司 制造 。 图 12-1 说 明了 一 个 阵列 处 理 器 的 结构 ， 其 中 二 维 处 理 单元 网 格 用 来 执行 从 
中 心 控 制 处 理 器 广播 出 的 指令 流 。 在 广播 每 条 指令 时 ， 所 有 的 单元 同时 执行 。 每 个 处 理 单元 与 
四 个 相 邻 的 单元 相连 以 便 进行 数据 交换 。 角 上 的 单元 与 相对 应 的 行 与 列 连接 ， 在 图 中 没有 给 出 。 


控制 处 理 器 





. i i 
广播 指令 ; ; 
处 理 单元 网 格 
图 12-1 阵列 处 理 器 


下 面 我 们 考虑 一 个 特殊 的 计算 来 理解 SIMD 结 构 的 计算 能 力 。 处 理 单元 网 格 可 以 解决 二 维 问 
题 。 例如， 如 果 网 格 的 每 个 单元 代表 空间 中 的 一 点 ， 那 么 阵列 可 以 用 来 计算 平面 区 域内 点 的 温 
度 。 假 定 平面 边缘 的 温度 是 固定 的 。 处 理 单元 所 表示 的 离散 点 的 近似 解决 方法 可 通过 以 下 步骤 
得 到 : 外 部 边缘 由 指定 的 温度 来 初始 化 。 内 部 点 是 用 任意 值 进行 初始 化 的 ， 各 点 之 间 可 以 不 同 。 
然后 反复 对 每 个 单元 进行 并 行 处 理 。 每 次 迭代 都 是 用 一 个 点 周围 的 四 个 最 近 相 邻 点 的 平均 值 来 
计算 ， 以 改善 该 点 处 的 温度 值 。 当 两 次 连续 和 迭代 之 间 估 算 值 的 变化 量 小 于 预先 定义 的 精度 时 ， 
就 停止 这 一 过 程 。 

阵列 处 理 器 的 处 理 能 力 在 进行 这 样 的 计算 时 绰绰有余 。 每 个 单元 必须 通过 图 中 所 示 的 路 径 
与 相 邻 点 交换 数据 。 在 每 个 处 理 单元 中 都 有 包含 一 些 存储 数据 的 寄存 器 和 本 地 内 存 。 为 了 便于 
与 相 邻 点 之 间 进 行 数据 交换 ， 又 设置 了 网 络 寄存 器 。 中 央 处 理 器 可 以 广播 指令 将 网 络 寄存 器 中 
的 数据 向 上 ， 下 ， 左 ， 右 四 个 方向 移动 一 步 。 每 个 单元 还 包含 一 个 ALU 来 执行 控制 处 理 器 所 广 
播 的 算术 指令 。 利 用 这 些 基本 的 设置 ， 就 可 以 重复 广播 指令 序列 并 执行 选 代 循环 。 控 制 处 理 器 
必须 能 够 检测 每 个 处 理 单元 的 温度 何 时 达到 所 要 求 的 计算 精度 。 为 实现 这 个 要 求 ， 每 个 单元 在 
内 部 设置 了 一 个 状态 位 ， 用 1 来 表示 该 条 件 已 经 成 立 。 互连网 格 还 包括 允许 控制 器 检测 在 迭代 结 
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束 时 所 有 的 状态 位 全 部 置 位 的 装置 。 

对 于 阵列 处 理 器 来 说 有 一 个 有 趣 的 问题 ， 就 是 面 对 少 量 功能 强大 的 处 理 器 和 大 量 功能 简单 
的 处 理 器 这 两 种 情况 ， 选 树 哪 种 效果 会 更 好 呢 ? ILLIAC-IV 是 支持 前 一 种 选择 的 典型 例子 。 该 处 
理 器 内 部 结构 由 64 个 64 位 处 理 器 构成 。20 世 纪 80 年 代 后 期 间 氟 的 阵列 处 理 器 是 后 一 种 选择 的 例 
子 。 由 Thinking Machines 公司 生产 的 CM-2 机 器 可 以 容纳 65 536 个 处 理 器 ， 而 每 个 处 理 器 位 宽 只 
有 一 位 。Maspar 公 司 的 MP-1216 可 容纳 处 理 器 的 最 大 数量 达到 了 16 384 个 ， 每 个 处 理 器 的 位 宽 是 
4 位 。Cambridge Parallel Processing Gamma I Plus 机 器 中 的 处 理 器 数 达 到 4 096 个 ， 并 且 可 以 处 理 
8 个 字 节 长 或 位 长 的 操作 数 。 这 些 选 择 反映 了 这 样 一 种 思想 ， 在 SIMD 环 境 中 ， 高 度 的 并 行 性 要 
比 少量 功能 强大 的 处 理 器 更 加 适用 。 

阵列 处 理 器 是 具有 很 强 针对 性 的 机 器 。 它 们 特别 适用 于 处 理 用 和 矩阵 或 向 量 形式 表示 的 数字 
问题 。 前 面具 有 向 量 体 系 结构 的 超级 计算 机 也 是 适合 解决 这 类 问题 的 。 基 于 向 量 的 机 器 与 阵列 
处 理 器 系统 的 主要 区 别 在 于 ， 前 者 是 通过 大 量 的 流水 线 技 术 以 达到 较 高 性 能 ， 而 后 者 是 通过 复 
制 计算 模块 来 提供 大 规模 的 并 行 能 力 。 无 论 是 阵列 处 理 器 还 是 向 量 机 都 只 是 用 于 对 通用 计算 进 
行 提速 ， 它 们 没有 很 大 的 商业 市 场 。 


12.3 通用 多 处 理 器 结构 


在 上 节 中 描述 的 阵列 处 理 器 主要 是 为 了 解决 计算 类 问题 而 设计 ， 这 类 计算 具有 明显 的 数据 
并 行 的 特点 。 而 对 于 一 般 的 并 行 性 不 是 很 明显 的 情况 ， 采 用 MIMD 体 系 结构 就 显得 更 加 有 效 ， 该 
体系 结构 中 包括 多 个 能 够 独立 并 行 处 理 不 同 程序 的 处 理 器 。 

图 12-2、 图 12-3 和 图 12-4 中 给 出 了 实现 多 处 理 器 系统 的 三 种 可 能 方式 。 最 常见 的 模式 如 图 12-2 
所 示 。 其 中 的 互连网 络 允许 n 个 处 理 器 访问 k 个 存储 器 ， 这 样 使 得 任何 处 理 器 可 以 访问 任意 一 个 存 
储 器 。 但 是 互连网 络 会 在 处 理 器 和 存储 器 之 间 带 来 一 定 的 延迟 。 最 普遍 的 情况 就 是 访问 所 有 存 
储 器 的 延迟 都 相同 ,这 种 机 器 称 为 统一 存储 器 访问 (Uniform Memory Access, UMA) 多 处 理 器 。 
因为 处 理 器 执行 指令 所 用 时 间 极 短 ， 从 存储 器 中 取 指令 和 数据 时 ， 网 络 中 的 延迟 如 果 太 长 是 无 
法 忍受 的 。 遗 憾 的 是 ， 具 有 很 短 延 迟 的 互连网 络 是 通过 提高 成 本 和 复杂 性 来 实现 的 。 
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另 一 种 较 好 的 选择 可 以 在 所 有 处 理 器 中 保持 较 高 的 计算 速度 ， 它 将 存储 器 和 处 理 器 直接 组 
织 在 一 起 。 这 种 组 织 结构 如 图 12-3 所 示 。 每 个 处 理 器 除了 可 以 访问 自己 的 存储 器 以 外 ， 还 可 以 通 
过 网 络 访问 其 他 存储 器 。 由 于 远程 访问 要 通过 网 络 ， 这 种 访问 相对 于 访问 本 地 存储 器 来 说 时 间 
要 长 一 些 。 因 为 访问 时 间 的 不 同 ， 这 样 的 多 处 理 器 称 为 非 统 一 存储 器 访问 (Non-Uniform 
Memory Access, NUMA ) 多 处 理 器 。 

图 12-2 和 图 12-3 所 示 的 组 织 结构 都 提供 了 全 局 存储 器 ， 每 个 处 理 器 可 以 访问 任何 存储 器 而 无 
须 干扰 其 他 的 处 理 器 。 在 图 12-4 中 给 出 了 一 种 以 不 同方 式 组 织 的 系统 。 其 中 ， 所 有 的 存储 器 都 是 
处 理 器 的 私有 存储 器 ， 并 且 和 处 理 器 直接 相连 。 一 个 处 理 器 在 没有 远程 处 理 器 的 协调 下 是 不 能 
访问 远程 存储 器 的 。 这 种 协调 通过 处 理 器 之 间 的 消息 交换 来 实现 。 这 样 的 系统 通常 称 为 带 有 消 
息 传 递 协 议 的 分 布 式 存储 器 系统 。 

前 面 是 将 处 理 器 和 存储 器 模块 作为 多 处 理 器 系统 的 主要 功能 单元 来 讨论 的 。 尽 管 我 们 没有 
明确 讨论 VO 模块 ， 但 是 任何 多 处 理 器 都 必须 提供 大 量 的 W/O 能 力 。 这 种 功能 可 以 通过 不 同 的 方式 
来 实现 。 单 独 的 W/O 模块 可 以 利用 标准 接口 直接 连接 到 网 络 上 ， 如 同 在 第 4 章 中 讨论 的 那样 。 有 些 
IO 功能 还 能 与 处 理 器 模块 做 成 一 体 。 

图 12-2、 图 12-3 和 图 12-4 是 站 在 较 高 的 层面 上 来 认识 这 些 可 能 的 多 处 理 器 组 织 结构 的 。 这 些 
机 器 的 性 能 和 成 本 主要 依赖 于 实现 的 细节 。 在 以 下 两 节 中 ， 我 们 将 研究 实现 通信 网 络 和 存储 器 
层次 结构 的 最 流行 方案 。 


12.4 互连网 络 


在 本 节 中 ， 我 们 检验 一 下 在 多 处 理 器 系统 中 实现 互连网 络 的 一 些 可 能 性 。 通常， 网 络 必须 
能 够 允许 信息 在 系统 中 任意 两 个 模块 之 间 进 行 传递 ， 同 时 还 可 以 利用 广播 将 信息 从 一 个 模块 传 
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送 到 其 他 的 模块 。 其 中 网 络 流量 是 由 请 求 〈 例 如 读 和 写 )、 数 据 传送 和 各 种 命令 组 成 。 

某 个 特定 网 络 是 否 适用 往往 是 通过 它 的 成 本 、 带 宽 、 有 效 吞 吐 量 和 实现 的 难 易 程 度 等 术语 
来 判断 的 。 带 宽 是 指 相关 数据 的 传输 能 力 ， 它 使 用 每 秒 传送 的 位 数 或 字 节 数 来 描述 。 有 效 吞吐 
重 是 数据 传输 的 实际 速率 。 这 个 速率 要 小 于 可 用 的 带宽 ， 因 为 一 个 指定 的 连接 并 不 是 一 直 都 在 
进行 数据 的 传送 ， 有 时 候 该 连接 是 处 于 空闲 状态 的 。 

网 络 传输 的 信息 通常 是 固定 长 度 和 固定 格式 的 包 。 例 如 ， 读 请 求 可 能 是 一 个 只 包含 源 地 址 
(处 理 器 模块 ) 和 目的 地 址 (存储 器 模块 ) 以 及 用 来 指示 读 操作 类 型 命令 字段 的 信息 包 。 向 存储 
器 模块 写 人 一 个 字 的 写 请 求 可 能 是 只 包含 被 写 数据 的 单个 信息 包 。 相 反 ， 一 个 包括 整个 高 速 组 
存 块 的 读 响应 需要 几 个 信息 包 。 更 长 的 信息 还 会 需要 更 多 的 信息 包 。 

理想 情况 下 ， 一 个 完整 的 信息 包 可 以 在 一 个 时 钟 周期 内 在 网 络 中 的 任何 节点 或 开关 上 并 行 
处 理 。 这 就 意味 着 要 有 许多 缆 线 构成 大 量 的 连接 。 为 了 降低 成 本 和 复杂 性 ， 通 常 尽 可 能 减 小 连 
接 的 宽度 。 在 这 种 情况 下 ， 一 个 信息 包 必须 分 成 更 小 的 信息 包 ， 以 便 使 每 个 小 的 信息 包 在 一 个 
时 钟 周 期 就 可 以 传送 到 。 


12.4.1 信和 号 总 线 


将 大 量 的 模块 互相 连接 起 来 的 最 简单 、 最 经 济 的 方法 是 使 用 信号 总 线 。 与 第 4 章 所 讨论 的 一 
样 ， 总 线 设 计 的 特点 在 这 里 也 适用 。 由 于 几 个 模块 是 与 总 线 连接 的 ， 因 此 每 个 模块 在 任何 时 刻 
都 可 以 请 求 进行 数据 传送 ， 这 样 就 必须 有 一 个 高 效 的 总 线 仲裁 方案 。 我 们 在 第 4 章 中 给 出 了 这 种 
方案 的 例子 。 

一 种 简单 的 操作 模式 就 是 在 整个 请 求 传送 期 间 ， 总 线 只 分 配给 特定 的 源 -目标 对 而 不 进行 另 
外 的 分 配 。 例 如 ， 当 处 理 器 在 总 线 上 发 出 一 条 读 指令 时 ， 它 就 会 占用 总 线 直 到 获得 来 自 内 存 的 
所 需 数据 为 止 。 由 于 存储 器 模块 需要 一 定 的 时 间 来 访问 数据 (在 第 5 童 中 描述 )， 总 线 就 会 一 直 
处 于 空闲 状态 直到 存储 器 将 数据 准备 好 ， 然 后 将 数据 传送 到 处 理 器 中 。 只 有 当 这 个 传送 结束 时 ， 
总 线 才 释 放出 来 进行 其 他 请 求 的 处 理 。 

假定 一 次 总 线 传输 用 7 个 时 间 单位 ， 内 存 访问 时 间 为 4T。 然 后 它 需 要 用 67 完 成 一 次 读 请 求 。 
这 样 总 线 就 会 有 2/3 的 时 间 处 于 空闲 状态 。 一 种 称 为 分 割 事务 协议 (split-transaction protocol) 的 
方案 可 以 使 总 线 在 空闲 期 间 为 其 他 请 求 提供 服务 。 考 虑 以 下 处 理 一 系列 来 自 不 同 处 理 器 读 请 求 
的 处 理 方法 问题 。 在 第 一 个 请 求 包 的 地 址 传送 完成 以 后 ， 总 线 可 以 重新 分 配给 第 二 个 请 求 来 传 
送 地 址 。 假 定 这 个 请 求 与 前 面 请 求 的 是 不 同 的 内 存 模块 ， 那 么 现在 这 两 个 模块 的 读 访问 周期 可 
以 并 行进 行 。 如 果 它们 都 没有 完成 访问 操作 ， 那 么 总 线 还 可 以 继续 分 配给 第 三 个 请 求 ， 依 次 类 
推 。 最 终 ， 第 一 个 内 存 模块 完成 了 它 的 访问 周期 后 ， 利 用 总 线 将 数据 传送 给 请 求 的 源 地 址 。 在 
其 他 模块 完成 各 自 的 周期 时 ， 也 利用 总 线 将 数据 传送 到 相应 的 源 地 址 。 需 要 注意 的 是 地 址 传送 
和 返回 字 之 闻 的 实际 时 间 长 度 不 是 关键 的 。 对 于 不 同 请 求 的 地 址 和 数据 传送 可 以 独立 表示 总 线 
按照 任意 顺序 交替 使 用 的 情况 。 

分 割 事务 协 议 多 许 更 有 效 地 使 用 总 线 和 可 用 的 带宽 。 该 协议 所 带 来 的 性 能 提高 主要 是 依赖 
于 总 线 的 传输 时 间 和 内 存 访问 时 间 两 者 之 间 的 关系 ， 而 且 提高 的 性 能 是 以 提高 总 线 复杂 性 为 代 
价 的 。 这 里 复杂 度 的 提高 有 两 点 原因 : 其 一 ， 内 存 模块 需要 知道 发 出 读 请 求 的 源 地 址 ， 必 须 在 
请 求 中 附带 着 请 求 源 的 标识 。 因 为 之 后 存储 器 要 利用 该 源 地 址 将 请 求 的 数据 发 送 回 去 ， 其 二 ， 
必须 是 所 有 模块 都 能 够 对 总 线 进行 控制 ， 而 不 仅仅 是 处 理 器 具备 该 功能 。 
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对 于 使 用 分 割 事务 总 线 的 多 处 理 器 系统 ， 其 处 理 器 数 的 范围 是 4 个 到 32 个 。 如 果 规模 再 增加 ， 
总 线 的 带宽 就 会 成 为 问题 。 更 宽 的 总 线 具 有 更 宽 的 带宽 ， 因 此 也 就 要 用 更 多 的 缆 线 。 大 多 数 在 
处 理 器 和 内 存 块 之 间 传 送 的 数据 都 是 由 高 速 缓存 块 构成 ， 每 个 块 中 有 几 个 字 。 如 果 总 线 宽 度 足 
以 每 次 传输 几 个 字 ， 那 么 ， 整 个 块 的 传输 会 比 一 次 传输 一 个 字 要 快 得 多 。 由 Silicon Graphic 公司 
开发 的 具有 挑战 性 的 多 处 理 器 计算 机 中 所 采用 的 是 允许 并 行 传输 256 位 数据 的 总 线 。 

然而 总 线 的 主要 限制 是 可 以 连接 到 总 线 的 模块 数量 不 能 过 高 。 如 果 一 条 总 线 上 连接 的 模块 
数 不 超 过 10 或 15 个 ， 它 会 很 正常 地 工作 。 利 用 更 宽 的 总 线 来 增加 带宽 可 以 使 连接 的 模块 数 加 倍 。 
但 总 线 的 带宽 受到 连接 使 用 的 总 线 的 限制 ， 同 时 由 于 连接 了 很 多 的 模块 而 带 来 加 电 引 起 的 传输 
延迟 相应 增加 ， 这 样 也 会 限制 带宽 。 所 以 ， 允 许多 个 独立 传输 操作 且 用 于 并 行 处 理 的 网 络 可 以 
大 大 提高 数据 的 传输 速度 。 


12.4.2 纵横 (Crossbar) 网 络 


图 12-5 中 给 出 了 多 功能 交换 装置 。 这 就 是 著名 的 纵横 开关 ， 它 最 初 是 为 电话 网 而 开发 的 。 为 
了 便于 说 明 ， 我 们 将 图 中 的 开关 描述 成 机 械 开关 ， 但 它们 实际 上 是 电子 开关 。 任 一 模块 Q; 可 以 
通过 适当 的 开关 与 任 一 个 开关 Q 相连 。 这 种 所 有 节点 之 间 都 直接 连接 的 网 络 称 为 全 连接 网 。 在 
全 连接 网 中 许多 传送 可 以 同时 进行 。 如 果 z 个 出 发 点 向 个 不 同 的 目的 地 发 送 数据 ， 那 么 这 些 传 
送 可 以 并 发 执行 。 因 为 传送 不 会 由 于 缺少 通信 路 径 而 被 阻塞 ， 所 以 crossbar 称 为 无 阻塞 交换 。 





图 12-5 纵横 互连网 络 


-在 图 12-5 中 我 们 看 到 在 每 个 交叉 点 处 只 有 一 个 开关 。 然 而 ， 在 实际 的 多 处 理 器 系统 中 ， 通 过 
纵横 网 的 路 径 是 非常 宽 的 。 这 就 意味 着 在 每 个 交叉 点 处 需要 设置 很 多 的 开关 。 由 于 将 n 个 模块 相 
互 连 接 起 来 需要 交 又 点 的 数量 是 x*?， 那 么 随 着 a 的 增长 开关 的 总 数 会 变 得 非常 庞大 。 其 结果 是 成 
本 很 高 并 且 实 现 复杂 。 纵 横 网 的 最 大 优势 就 是 当 节点 的 数量 不 是 很 大 时 可 提供 良好 的 网 络 互 连 
能 力 。 

在 Sun 公 司 的 E10000 系 统 中 实现 了 一 个 较 大 的 纵横 开关 ， 它 采用 16 x 16 的 格式 ， 连 接 16 个 4 
处 理 器 的 节点 。 该 系统 中 使 用 了 多 级 的 纵横 开关 ， 其 中 第 一 级 纵横 开关 连接 到 第 二 级 的 纵横 开 
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关上 ， 依 次 类 推 。 按 照 这 种 方式 可 以 连接 更 多 的 处 理 器 。 这 种 方法 还 被 Fujitsu 公 司 的 VPP5000、 
Hitachi 公 司 的 SR8000 和 NEC 公 司 的 SX-5 等 机 器 所 采用 。 对 于 高 性 能 的 互 连 媒 质 来 说 ， 这 和 “级 
的 纵横 结构 已 经 成 为 一 种 流行 趋势 。 


12.4.3 多 上 段 网 络 


刚刚 描述 的 总 线 和 纵横 系统 只 用 一 段 开关 在 源 地 址 到 目的 地 址 之 间 提 供 路 径 。 此 外 ， 还 可 
以 利用 多 段 开关 来 实现 互 连 ， 即 在 源 地 址 和 目的 地 址 之 间 建 立 起 多 条 路 径 。 这 样 的 网 络 相 对 于 
纵横 结构 来 说 成 本 更 低 ， 但 却 能 够 在 源 地 址 和 目的 地 址 之 间 提 供 相当 多 的 并 行路 径 。 最 好 通过 
一 个 实例 来 说 明 。 图 12-6 中 给 出 了 一 个 称 为 混 洗 网 (Shuffle network) 的 三 段 网 络 ， 它 互 连 了 八 
个 模块 。 其 中 术语 “ 混 洗 ”描述 从 一 个 段 输出 到 下 一 段 输 入 的 连接 方式 。 这 种 方式 与 玩 纸牌 中 
重新 混 洗 的 方法 相同 ， 也 就 是 将 纸牌 分 成 两 半 相 互 交 叉 进行 混合 。 

图 中 的 每 个 开关 盒 是 一 个 2 x 2 的 开关 ， 这 样 可 以 对 输入 和 输出 进行 路 由 。 如 果 输 入 请 求 的 
是 不 同 的 输出 ， 那 么 它们 可 以 同时 按照 直接 通过 或 交叉 方式 进行 路 由 。 如 果 有 两 个 输入 请 求 相 
同 的 输出 ， 那 只 能 满足 其 中 一 个 ， 另 一 个 将 被 阻塞 直到 前 一 个 请 求 使 用 完 开 关 后 才 可 以 执行 。 
可 以 看 出 ， 一 个 由 s 段 构成 的 网 络 可 以 连接 2: 个 模块 。 在 本 例 中 从 网 络 的 任意 模块 Q; 到 其 他 任意 
模块 Q 只 有 一 条 通路 。 因 此 ， 该 网 络 在 源 和 目的 地 之 间 提 供 的 是 全 连接 。 但 是 ， 当 有 很 多 请 求 
模式 时 是 不 能 同时 满足 的 。 例 如 ， 从 Qo 到 Q4 与 Q, 到 Q; 之 间 的 连接 就 不 能 同时 提供 。 





图 12-6 多 段 混 洗 网 
多 段 网 络 与 纵横 网 相 比 ， 实 现 起 来 成 本 更 低 一 些 。 如 果 用 图 12-6 中 的 方式 来 连接 n 个 节点 ， 
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那么 必须 用 s = log2n 个 段 ， 每 段 有 n/2 个 开关 盒 。 由 于 每 个 开关 盒 中 包含 4 个 开关 ， 那 么 开关 的 总 
数量 是 


4x 5 xlog,n = 2nxlog,n 


对 于 较 大 的 网 络 ， 显 然 比 在 纵横 网 中 用 痉 个 开关 要 少 很 多 。 

利用 下 面 的 方法 可 以 将 一 个 特殊 的 请 求 通过 这 种 网 络 进行 路 由 。 源 地 址 向 网 络 中 发 送 一 个 
用 二 进 制 形式 表示 的 目标 地 址 数 。 当 这 个 数 在 网 络 中 传送 时 ， 每 段 都 检测 一 个 不 同位 来 决定 开 
关 的 设置 。 第 一 段 使 用 最 高 位 ， 第 二 段 使 用 中 间 位 ， 第 三 段 使 用 最 低位 。 当 有 请 求 到 达 开 关 的 
输入 时 ， 如 果 控 制 位 是 0， 就 从 高 位 输出 ， 如 果 控 制 位 是 1， 就 从 低位 输出 。 例 如 ， 一 个 请 求 从 
JAQ: 到 目的 地 Q:， 它 通过 网 络 所 走 的 路 径 在 图 12-6 中 用 粗 线 画 出 。 它 的 路 由 是 根据 目标 地 址 的 
位 串 011 来 进行 控制 的 。 

基于 多 段 网 络 的 多 处 理 器 有 一 个 更 好 的 例子 ， 是 由 BBN Advanced Computers 公司 制造 的 
BBN Butterfly。 它 是 一 个 64 处 理 器 模型 ， 其 中 包含 一 个 用 4 x 4 开关 构建 的 三 段 网 络 。 通 过 每 段 开 
关 的 路 由 是 利用 目标 地 址 中 连续 的 两 位 来 控制 的 。 最 近 的 例子 则 是 IBM RS/6000 SP 多 处 理 器 ， 
该 系统 可 使 用 多 段 网 络 ( 选 件 之 一 ) 连接 处 理 器 群 。 

多 段 网 络 与 纵横 网 相 比 ， 其 所 提供 的 并 发 连接 能 力 要 弱 一 些 ,， 但 是 它 的 实现 成 本 却 很 低 。 
这 种 网 络 方案 在 20 世 纪 80 年 代 迅 速 流行 并 达到 赔 峰 ， 但 是 在 之 后 的 几 年 很 快 就 冷 了 下 来 。 在 本 
章 后 续 部 分 所 讨论 的 方案 会 更 具有 吸引 力 。 


12.4.4 超 立 方 体 网 络 


在 前 面 讨论 的 三 种 方案 中 ,互连网 络 为 连接 任意 的 两 个 模块 提供 通路 ， 同 时 也 带 来 了 时 间 
延迟 。 这 种 方案 可 以 用 于 实现 UMA 多 处 理 器 。 我 们 现 
在 讨论 只 适用 于 NUMA 多 处 理 器 的 网 络 拓扑 。 第 一 种 
流行 方案 使 用 的 是 n 纵 立方 体 的 拓扑 结构 ， 称 为 超 立 方 
体 结构 ， 它 实现 了 一 个 连接 2" 个 节点 的 网 络 。 除 了 通 
信息 路 外 ， 每 个 节点 通常 包括 一 个 处 理 器 和 一 个 具有 
一 定 IO 能 力 的 存储 器 模块 。 

图 12-7 给 出 的 是 3 维 的 超 立 方 体 。 其 中 ， 小 圆圈 代 
表 一 个 节点 的 通信 和 电路。 图 中 没有 给 出 每 个 节点 相连 
的 功能 单元 。 立 方 体 的 边 代 表 相 邻 节点 之 间 的 双向 通 s ° 


N 
(111) 





< 
信 连 接 。 在 n 维 超 立 方 体 中 ， 每 个 节点 直接 与 4 个 相 邻 OO (100) 
节点 相连 。 这 里 采用 为 节点 分 配 二 进 制 地 址 的 方式 来 图 12-7 3 维 超 立方 体 网 络 


进行 标注 ， 这 样 任何 两 个 相 邻 节点 的 地 址 之 间 只 有 一 位 不 同 ， 如 图 所 示 。 

通过 超 立 方 体 的 路 由 消息 相当 简单 。 如 果 节 点 N; 上 的 处 理 器 要 向 节点 Nj 发 送 消息 ， 将 按 昭 
如 下 方式 进行 处 理 : 将 二 进 制 形式 的 源 节 点 j 和 目标 节点 /从 低位 向 高 位 进行 比较 。 假 定 第 一 个 不 
同 的 位 是 p。 则 节点 Ni 向 它 的 相 邻 节点 (地 址 是 £:， 且 与 ;在 p 位 不 同 ) 发 送 消 息 。 节 点 Ni 继续 利用 
同样 的 比较 方法 将 消息 发 送 到 相应 的 相 邻 节点。 这 样 ， 消 息 会 随 着 从 一 个 节点 到 另 一 节点 的 一 
次 次 跳跃 而 逐渐 接近 目标 节点 Nj。 例 如 ， 从 节点 Nz 到 节点 N; 的 消息 需要 经 过 节点 Nb 和 节点 Ni 的 
3 步 跳 跃 。 在 一 个 n 维 的 超 立 方 体 中 ， 任 何 消息 需 走 的 最 大 距离 是 n 步 跳跃 。 
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从 右 向 左 扫描 地 址 的 方法 仅仅 是 用 来 决定 消息 路 由 方法 中 的 一 种 。 还 可 以 采用 其 他 如 每 步 
跳跃 都 能 将 消息 向 目标 点 传送 的 方法 ， 只 要 在 路 径 上 的 每 个 节点 可 以 通过 当前 的 信息 做 出 路 由 
决策 就 可 以 。 超 立方 体 的 优点 是 它 的 可 靠 性 。 两 个 节点 之 间 存 在 多 条 路 径 就 意味 着 当 存在 连接 
冲突 时 ， 遂 过 简单 的 局 部 路 由 选择 就 很 容易 将 其 避免 。 如 果 最 短 的 路 径 不 能 使 用 ， 那 么 消息 可 
能 要 通过 更 长 一 些 的 路 径 来 发 送 。 这 时 必须 要 注意 避免 形成 环 ， 如 果 一 旦 形成 一 个 封闭 的 环 ， 
消息 就 处 在 环 内 而 永远 不 能 到 达 目 标点 了 。 

超 立 方 体 互连网 络 已 经 被 很 多 机 器 所 采用 。 比 较 有 名 的 例子 包括 Intel 的 PSC， 它 使 用 了 连接 
128 个 节点 的 7 维 立方 体 ， 还 有 NCUBE 的 NCUBE/ten， 使 用 了 连接 1924 个 节点 的 10 维 立方 体 。 在 
20 世 纪 90 年 代 早期 ， 由 于 更 具 吸 引力 的 基于 网 格 结构 网 络 的 出 现 ， 而 使 超 立 方 体 网 络 不 再 流行 。 


12.4.5 网 状 网 络 


将 大 量 节 点 连接 起 来 的 最 自然 连接 方式 就 是 通过 网 格 (mesh)。 在 图 12-8 中 给 出 了 16 个 节点 
的 网 状 网 的 例子 。 节 点 之 间 的 连接 是 双向 的 。 网 状 网 是 在 20 世 纪 
90 年 代 流 行 起 来 的 ， 已 经 在 本 质 上 取代 了 超 立 方 体 网 ， 成 为 大 量 
多 处 理 器 互连网 络 的 主要 选择 。 

网 状 网 络 中 的 路 由 可 以 有 几 种 不 闻 的 方式 。 其 中 最 简单 也 是 
最 有 效 的 一 种 就 是 在 源 节点 N; 和 目标 节点 Nj 之 间 选 择 一 条 路 径 ， 
传输 按照 水 平方 向 从 N; 到 Nj 进行 。 当 到 达 N 所 在 的 列 时 ， 传 输 沿 
着 这 个 列 在 垂直 方向 进行 。 基 于 网 状 网 络 多 处 理 器 的 几 个 知名 的 
实例 是 : Intel 的 Paragon、 斯 坦 福 大 学 的 实验 机 Dashtl Flashi! 以 
KMITEJAlewifel5) 。 

如 果 将 图 12-8 中 对 边 的 节点 相互 连接 ， 结 果 这 个 网 络 就 变 成 
了 在 X 方 向 和 Y 方 向 上 都 是 双向 环 的 网 。 这 种 网 通常 称 为 加 环形 (torus) 网 络 ， 它 可 以 减 小 信息 
传输 的 平均 延迟 ， 但 它 是 以 提升 复杂 性 为 代价 的 。Fujitsu 公 司 的 AP3000 使 用 的 就 是 这 种 网 络 。 

规则 的 网 状 和 圆 环形 都 能 实现 3 维 网 络 。 相 邻 节 点 在 X、Y 和 Z 三 个 方向 上 进行 连接 ， 在 Cray 
T3E 多 处 理 器 中 就 有 3 维 圆 环形 的 例子 。 


12.4.6 树 状 网 络 


图 12-8 一 个 2 维 的 网 状 网 


按照 树 的 形状 实现 的 网 络 层次 结构 是 另外 一 种 互 连 拓 扑 结构 。 图 12-9a 给 出 了 连接 16 个 模块 
的 4 路 树 结构 。 树 中 每 个 父 节 点 一 次 可 以 与 两 个 子 节点 进行 通信 。 中 间 节 点 ， 如 图 中 的 节点 A， 
可 以 提供 从 一 个 子 节点 到 该 中 间 节 点 的 父 节点 的 一 个 连接 。 这 就 使 得 任意 距离 的 两 个 叶 节 点 能 
够 相互 通信 。 在 树 中 的 一 个 给 定 的 节点 上 一 次 只 能 建立 一 条 通路 。 

如 果 大 量 的 通信 都 是 局 部 的 ， 也 就 是 只 有 一 小 部 分 网 络 通信 经 由 单一 的 根 节 点 进行 ， 那 么 
树 状 网 络 会 运行 良好 。 如 果 不 是 这 种 情况 ， 根 节点 将 会 成 为 瓶颈 ， 从 而 使 网 络 的 整体 性 能 迅速 
下 降 。 

为 了 降低 出 现 瓶 颈 的 可 能 性 ， 可 以 增加 在 树 状 层次 结构 中 较 高 层 的 连接 数目 。 因 此 腾 树 网 
络 应 运 而 生 ， 树 中 每 个 节点 〈 除 了 最 顶层 的 根 节 点 外 ) 都 有 一 个 以 上 的 父 节点 。 图 12-9b 中 给 出 
了 一 个 胖 树 的 例子 。 这 个 例子 中 每 个 节点 都 有 两 个 父 节点 。 胖 树 结构 在 Thinking Machines 公 司 的 
CM-5 机 器 中 所 采用 。 








b) 胖 树 
图 12-9 树 状 网 络 


12.4.7 环 状 网 络 


最 简单 的 网 络 拓扑 之 一 是 使 用 一 个 环 将 系统 中 的 节点 连接 起 来 ， 如 图 12-10a 所 示 。 这 种 结构 
的 主要 优点 是 环 很 容易 实现 。 由 于 每 个 节点 只 与 两 个 相 邻 点 连接 ， 所 以 环 中 的 连接 可 以 很 宽 ， [@j] 
通常 能 容纳 并 行 处 理 中 的 一 个 完整 的 信息 包 。 然 而 ， 将 很 多 节点 连接 成 一 个 非常 长 的 环 是 没有 
用 的 ， 因 为 信息 的 传输 延迟 会 太 长 ， 以 至 于 无 法 接受 。 


高 层 环 


低层 坏 





b) 分 层 环 


图 12-10 环 状 互连网 络 
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环 还 可 以 作为 构建 块 用 在 前 面 所 讨论 的 拓扑 结构 中 ， 如 网 状 、 超 立方 体 、 树 以 及 胖 树 。 考 
虑 一 个 环 用 在 树 状 结构 中 的 简单 例子 ， 一 个 用 环形 成 的 分 层 结构 如 图 12-10b 所 示 。 图 中 描述 了 两 
层 的 环 状 结构 ， 还 可 以 有 更 多 层 。 在 包括 相同 节点 数 的 环 上 ， 短 环 可 以 大 大 地 减少 传输 延迟 。 
此 外 ， 在 不 同 环 的 两 个 节点 之 间 的 传输 延迟 会 比 在 单 环 中 小 。 但 是 这 种 方案 的 缺点 是 : 最 顶层 
的 环 可 能 会 成 为 传输 的 瓶颈 。 

具有 环 状 网 络 特征 的 商用 机 器 包括 Hewlett-Packard 生 产 的 样机 V2600 和 Kendal Square 
Research 研 制 的 KSR-2。 在 多 伦 多 大 学 的 实验 机 Hectoud 和 NUMAchinem! 中 也 采用 了 环 状 网 络 。 


12.4.8 实用 性 因素 


我 们 已 经 了 解 了 在 多 处 理 器 系统 中 实现 互连网 络 的 几 种 不 同 的 拓扑 结构 。 很 难说 哪 种 拓扑 
结构 明显 好 于 其 他 的 结构 。 每 种 结构 都 有 特定 的 优 缺点 。 当 对 不 同 的 方法 做 比较 时 ， 必 须 将 几 
个 实用 性 因素 考虑 进去 。 

最 基本 的 要 求 就 是 通信 网 络 要 足够 快 ， 并且 要 具有 是 够 的 吞吐 量 来 满足 多 处 理 器 系统 中 的 
传输 需求 。 这 就 意味 着 在 通信 路 径 上 要 有 很 高 的 传输 速度 ， 并 且 要 有 一 个 简单 的 路 由 机 制 来 保 
证 能 快速 地 做 出 路 由 决策 。 网 络 必须 容易 实现 ， 配 线 的 复杂 度 必 须 是 合理 的 并 且 能 够 简单 打包 ，。 
复杂 度 是 网 络 成 本 的 必然 反映 ， 也 是 要 考虑 的 另外 一 个 重要 因素 。 

多 处 理 器 的 规模 是 不 同 的 。 理 想 的 网 络 应 该 适用 于 所 有 规模 ， 规 模 的 范围 可 以 从 只 有 几 个 
处 理 器 到 有 成 千 上 万 个 处 理 器 。 术 语 可 伸缩 性 经 常用 来 描述 多 处 理 器 体系 结构 (包括 互连网 络 ) 
随 着 系统 规模 的 增加 ， 性 能 也 可 以 增加 的 能 力 。 如 果 一 个 比较 小 的 多 处 理 器 系统 可 以 在 低 成 本 
下 构成 ， 但 是 它 能 够 很 容易 地 扩展 成 一 个 庞大 的 系统 ， 并 且 其 价格 和 性 能 是 按照 线性 增长 的 ， 
那么 这 个 系统 的 优势 就 很 明显 了 。 通 常 ， 前 期 的 一 个 小 系统 成 本 也 是 很 大 的 ， 因 为 一 个 大 系统 
中 所 需 的 大 多 数 通信 硬件 在 小 系统 中 也 必须 提供 。 

除了 在 源 地 址 和 目标 地 址 之 间 进 行 基本 通信 以 外 ， 将 一 个 消息 传送 到 整个 网 络 可 以 被 所 有 
节点 接收 的 广播 能 力也 很 有 用 。 而 只 给 网 络 节点 中 的 一 个 子 节点 发 送 消息 的 能 力也 是 很 有 益 的 ， 
这 种 传输 称 为 多 播 。 

互连网 络 的 选择 通常 会 影响 所 选 方案 的 实现 ， 这 些 方案 用 来 保证 在 每 个 不 同 处 理 器 的 高 束 
缓存 中 保存 共享 数据 的 副本 ， 在 需要 更 新 时 及 时 更 新 ， 以 便 所 有 副本 的 值 都 相同 。 这 样 的 方案 
我 们 将 在 12.6.2 节 中 讨论 。 

可 靠 性 是 另外 一 个 重要 因素 。 越 复杂 的 网 络 就 越 难 保证 其 可 靠 性 。 理 想 情况 是 机 器 在 网 络 
连接 中 有 一 些 故 障 时 也 能 继续 运转 。 这 就 要 求 在 一 对 通信 节点 之 间 至 少 要 存在 两 条 不 同 的 通路 。 
通常 情况 下 ， 简 单 的 网 络 注重 稳健 性 ， 它 的 故障 率 通常 比 系统 中 的 处 理 器 和 内 存 模块 低 很 多 。 
包括 有 额外 硬件 的 高 可 靠 性 网 络 的 构建 成 本 是 相当 高 的 。 这 个 话题 已 经 超出 了 本 书 的 范围 。 

为 了 说 明 怎 样 评估 这 些 因素 ， 让 我 们 基于 网 状 网 络 和 环 状 网 络 来 做 一 个 简要 的 定性 比较 。 

网 状 和 环 状 

网 状 网 络 和 环 状 网 络 的 特点 都 是 采用 可 以 在 高 速 时 钟 频率 驱动 下 的 点 对 点 连接 (连接 相 邻 
点 )。 两 者 都 具有 结构 简单 并 且 容易 扩展 的 特性 。 在 环 上 增加 扩展 相对 于 网 状 来 说 要 更 简单 一 些 。 

在 图 12-8 和 图 12-10 中 ， 我 们 将 网 络 中 的 节点 表示 成 小 贺 圈 并 用 单线 连接 。 下 面 看 一 个 更 详 
细 的 图 。 图 12-11 中 显示 的 是 与 带 有 一 个 处 理 器 模块 的 节点 相连 的 通信 路 径 。 开 关 块 中 包括 为 伟 
输 选 择 路 径 的 电路 和 用 来 缓存 正在 传输 数据 的 缓冲 器 。 每 个 时 钟 周期 内 ， 数 据 从 一 个 节点 的 组 
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冲 器 传送 到 下 一 节点 的 缓冲 器 。 图 12-11a 描 绘 了 2 维 网 状 网 络 中 的 一 个 节点 。 由 于 在 X 方 向 和 Y 方 
向 上 都 需要 双向 通信 ， 所 以 一 个 节点 必须 有 八 个 不 同 的 网 络 连 
接 。 从 成 本 和 封装 的 因素 考虑 ， 其 连接 宽度 受到 使 用 缆 线 总 数 
量 的 限制 。 这 样 ， 单 个 的 连接 不 可 能 宽 到 足以 并 行 传送 整个 信 
息 包 的 程度 。 为 了 解决 这 些 限制 ， 可 以 将 一 个 信息 包 分 割 成 相 






应 于 连接 宽度 的 较 小 部 分 进行 处 理 。 术 语 flit ( 流 控 制 数 ) 通常 SG 

是 指 一 个 信息 包 的 一 部 分 ， 这 个 部 分 可 以 被 节点 中 的 开关 电路 
所 接受 并 向 前 传送 ， 或 者 是 在 向 前 的 通道 中 被 其 他 传输 阻塞 而 | 处 理 模块 
进行 缓冲 。 实 际 上 ， 为 了 方便 起 见 ， 通 常 将 flit 的 宽度 和 连接 宽 

度 置 成 相同 大 小 。 CS A 


如 果 一 个 信息 包 必 须 分 成 Hit， 那 么 该 如 何 将 它 通过 网 络 进 


行路 由 呢 ? 一 种 直接 的 方法 是 称 为 存储 -转发 的 方式 ， 它 在 每 个 
节点 处 都 提供 了 大 量 的 缓冲 器 用 来 保存 信息 包 的 所 有 flit。 这 样 
一 个 完整 的 信息 包 就 可 以 从 一 个 节点 传送 到 另 一 个 节点 ， 并 在 


每 个 节点 中 存储 直到 可 以 传送 到 下 一 节点 为 止 〈 传 输 所 需 的 时 


钟 周期 数 是 由 人 it 的 数量 决定 的 )。 这 种 方法 的 负面 影响 是 所 需 的 


缓冲 器 大 小 以 及 增加 了 通过 一 个 节点 的 时 间 延 迟 。 一 个 更 好 的 


选择 是 采用 虫 孔 (wormhole) 路 由 策略 (可 以 参看 流水 线 部 分 )， b) 环 状 网 络 中 的 节点 
它 可 以 将 构成 信息 包 的 一 系列 flit 看 成 是 穿 过 网 络 的 一 条 虫子 。 ”图 12-11 网 状 网 络 和 环 状 
虫子 中 的 第 一 个 flit 包 含 了 带 有 目标 节点 地 址 的 头 部 。 当 这 个 flit 网 络 中 的 节点 


穿 过 网 络 时 ， 它 就 建立 了 一 条 通路 ， 其 余 的 flit 可 以 沿 着 这 条 通路 进行 传输 。 虫 子 的 尾部 关闭 所 
建立 的 通路 。 因 为 其 他 虫子 也 许 会 经 过 同一 个 节点 ， 所 以 虫子 的 头 部 可 能 是 任何 节点 的 临时 块 。 
然而 ， 一 旦 头 部 开始 移动 ， 那 么 虫子 的 其 余部 分 会 在 后 续 的 时 钟 周 期 跟着 移动 。 当 虫子 的 头 部 
被 阻塞 时 ， 必 须 有 控制 机 制 来 停止 那些 来 自前 面 节点 的 fit 的 传送 。 一 种 简单 的 方法 是 每 个 节点 
将 两 个 缓冲 器 分 别 用 于 两 个 传输 方向 &。 虫 孔 路 由 与 存储 -转发 路 由 相 比 ， 其 传输 延迟 更 小 ， 因 
为 它 头 部 flit 的 发 送 无 须 等 待 该 包 中 其 余 的 fit， 

虫 孔 路 由 是 线路 交换 策略 的 一 种 应 用 ， 该 策略 是 电话 网 中 的 常见 概念 ， 当 呼叫 方 拨打 一 个 
电话 号 码 时 就 建立 一 条 通过 网 络 的 路 径 。 通 话 进行 的 路 经 称 为 线路 。 当 呼叫 方 挂 起 电话 时 就 解 
除了 该 线路 。 在 虫 孔 路 由 中 是 通过 头 部 flit 建 立 通路 的 。 这 个 flit 前 进 的 过 程 也 许 会 被 临时 阻塞 。 
一 旦 建立 起 一 条 线路 ， 信 息 包 的 其 余 flit 就 向 目标 移动 ， 而 无 须 任何 的 竞争 。 相 反 ， 整 个 信息 包 
在 每 个 节点 进行 缓存 的 策略 ， 如 存储 -转发 的 方法 ， 这 称 为 包 交 换 。 这 种 情况 无 须 建 立 线路 ， 只 
要 每 个 节点 有 可 用 的 缓冲 器 就 可 以 将 信息 包 通过 网 络 进行 传送 。 

图 12-11b 中 给 出 了 一 个 环 状 网 络 中 的 节点 连接 。 这 里 除了 连 有 处 理 模块 以 外 ， 只 进行 单方 向 
的 传输 。 这 样 ， 连 接 的 宽度 就 是 同样 数量 缆 线 的 网 状 网 络 的 四 倍 。 这 也 就 意味 着 可 以 将 整个 信 
息 包 在 一 个 时 钟 周期 内 从 一 个 节点 并 行 地 传送 到 另 一 节点 。 图 12-11b 中 给 出 了 在 环 的 最 低层 的 一 
个 连 有 处 理 模 块 的 节点 。 如 果 使 用 的 是 图 12-10b 中 的 环 状 分 层 结构 ， 那 么 ， 在 低层 与 高 层 之 间 的 
内 环 接 口 将 有 两 个 输入 连接 和 两 个 输出 连接 ， 高 层 环 和 低层 环 中 每 种 连接 的 接口 将 各 占 一 个 。 

分 层 结构 的 环 状 网 络 中 的 路 由 是 非常 简单 的 。 除 了 在 高 层 网 和 低层 网 的 输入 信息 包 都 要 同 
时 连续 使 用 环 中 同一 个 内 环 接口 的 情况 下 会 出 现 阻塞 以 外 ， 其 他 情况 下 信息 包 是 永远 不 会 被 阻 
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塞 的 。 为 了 处 理 这 种 情况 ， 必 须 在 接口 处 提供 缓冲 器 (队列 )， 一 个 用 于 从 低层 环 到 高 层 环 ， 田 
一 全 用 于 相反 方向 。 只 要 上 游 的 相 邻 点 没有 信息 包 到 达 该 节点 时 ， 处 理 模块 就 可 以 向 环 上 输入 
一 个 新 的 信息 包 。 

下 面 要 看 一 下 网 络 广播 和 多 播 数 据 的 能 力 。 这 种 能 力 是 环 状 网 络 天 生 就 具备 的 。 例 如 ， 可 
以 通过 将 一 个 信息 包 发 送 到 最 顶 县 环 的 方式 来 广播 给 所 有 的 节点 。 当 这 个 信息 包 穿 过 这 个 环 时 ， 
在 每 个 内 环 接口 处 都 拷贝 一 份 并 将 其 继续 发 送 给 低层 环 。 这 一 过 程 在 所 有 层 中 重复 进行 ， 以 便 
最 初 的 信息 包 可 以 访问 最 底层 的 所 有 节点 。 网 状 网 中 的 广播 相对 来 说 就 困难 一 些 ， 因 为 广播 包 
要 分 成 fit， 并 且 广 播 过 程 中 的 虫子 可 能 在 不 同 的 节点 被 其 他 传输 所 阻塞 。 此 外 ， 广 播 的 完成 不 
容易 检测 。 

分 层 环 状 网 络 的 主要 缺点 是 ， 环 的 最 顶层 可 能 会 因为 过 多 的 信息 包 通过 而 成 为 瓶颈 。 当 局 
部 通信 很 少时 就 会 发 生 这 种 情况 。 顶 层 环 的 有 限 带 宽 限 制 了 基于 该 网 系统 的 可 伸缩 性 ， 所 以 只 
能 达到 几 百 个 处 理 器 。 相 反 ， 基 于 网 状 的 系统 可 以 连接 上 千 个 处 理 器 。 

从 前 面 讨论 中 可 以 看 出 网 状 和 环 状 都 是 实现 互连网 络 的 不 错 选择 。 基 于 环 状 的 系统 容易 实 
现 , 但 它 的 扩展 性 不 如 基于 网 状 的 系统 好 。 如 果 系 统 的 最 大 规模 是 几 百 个 处 理 器 的 话 ， 那 么 环 
状 网 的 优势 是 很 明显 的 。 网 状 网 在 小 系统 和 非常 大 的 系统 中 也 很 适用 。 对 于 非常 小 的 系统 ， 比 
如 有 16 个 处 理 器 。 最 有 效 的 选择 是 单 总 线 或 纵横 网 络 。 

由 于 多 处 理 器 系统 的 规模 具有 重要 的 意义 ， 读 者 也 许 想 知道 实际 中 使 用 的 是 什么 范围 的 系 
统 。 大 多 数 多 处 理 器 系统 相对 较 小 。 很 多 机 器 有 4 到 128 个 处 理 器 。 虽 然 也 有 上 千 个 处 理 器 的 大 
型 机 ， 但 是 这 种 市 场 需求 却 是 很 小 的 。 


12.4.9 混合 拓扑 网 络 


我 们 已 经 讨论 了 几 种 可 能 的 网 络 拓扑 结构 ， 并 展示 了 这 些 拓 扑 结构 所 具有 的 优 缺 点 。 多 处 
理 器 系统 的 设计 者 努力 实现 在 合理 的 开销 下 能 获得 较 高 的 性 能 。 在 开发 不 同 拓扑 所 具有 的 最 
有 力 特 点 的 同时 ， 很 多 成 功 的 机 器 采用 了 混合 的 拓扑 结构 。 总 线 和 纵横 网 络 在 连接 少量 的 处 
理 器 时 是 极 好 的 选择 。 所 以 ， 我 们 通常 会 看 到 利用 一 条 总 线 或 一 个 纵横 方向 连接 2 到 8 个 处 理 
器 的 处 理 器 群 。 这 样 的 群 通常 作为 一 个 节点 ， 然 后 采用 合适 的 拓扑 来 相互 连接 形成 一 个 更 大 
的 系统 。 

Data General 公 司 的 AV25000 系 统 使 用 总 线 相连 的 处 理 器 作为 节点 ， 然 后 这 些 节 点 再 用 环 状 
网 连接 起 来 。Hewlett-Packard 的 样机 V2600 也 是 采用 环 状 网 连接 节点 ， 每 个 节点 用 一 个 纵横 开关 
连接 处 理 器 。 康 柏 的 AlphaServer SC 使 用 胖 树 连接 节点 ， 构 成 节点 的 处 理 器 用 纵横 开关 连接 。 


12.4.10 ”对称 式 多 处 理 器 


假如 一 个 多 处 理 器 系统 中 ， 所 有 处 理 器 访问 所 有 的 内 存 模块 和 1/O 设 备 的 机 会 都 是 相同 的 ， 
这 样 操作 系统 软件 可 以 将 任意 一 个 处 理 器 与 其 他 处 理 器 进行 交换 。 那 么 ， 如 果 任 意 一 个 处 理 器 
都 能 执行 操作 系统 的 内 核 或 用 户 程序 ， 这 种 机 器 称 作为 对 称 式 多 处 理 器 (SMP)。 也 就 是 说 任何 
一 个 处 理 器 都 能 初始 化 任何 IO 设备 的 IO 操作 ， 以 及 能 够 处 理 外 部 的 中 断 。 

SMP 通 常 是 采用 总 线 或 纵横 网 来 实现 的 。 它 经 常 在 超大 规模 多 处 理 器 系统 中 当 作 一 个 节点 
使 用 。 例 如 ， 上 面 所 说 的 样机 V2600 和 AlphaServer SC 多 处 理 器 中 的 节点 就 是 SMP。 
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在 第 5 章 中 我 们 看 到 单 处 理 器 系统 中 存储 器 的 组 织 结构 对 性 能 有 重大 影响 。 多 处 理 器 系统 中 
也 是 同样 。 为 了 利用 引用 局 部 性 ， 每 个 处 理 器 通常 都 带 有 一 个 主 高 速 缓存 和 一 个 辅助 高 速 缓存 。 
如 果 采 用 图 12-2 中 所 示 的 机 制 ， 那 么 每 个 处 理 器 模块 将 
连接 到 通信 网 上 ， 如 图 12-12 所 示 。 由 于 假设 主 高 速 组 
存 是 处 理 器 芯片 的 一 部 分 ， 所 以 图 中 只 显示 了 辅助 高 x 
速 缓 存 。 存 储 器 模块 的 访问 采用 的 是 惟一 的 全 局 地 址 I 
空间 ， 每 个 存储 器 模块 分 配 有 一 个 确定 的 物理 地 址 范 Er 
围 。 在 这 种 共享 存储 器 系统 中 ， 处 理 器 以 同样 的 方式 
来 访问 所 有 的 存储 器 模块 。 从 软件 的 角度 来 看 ， 这 样 J 
使 用 地 址 空间 是 最 简单 的 方式 。 网 络 接口 

在 NUMA 结 构 的 多 处 理 器 中 ， 如 图 12-3 所 示 ， 每 个 
节点 包含 一 个 处 理 器 和 一 部 分 存储 器 。 实 现 节点 最 自 
然 的 一 种 方式 在 图 12-13 中 于 以 了 说 明 。 在 本 例 中 , 还 “一 过 网 络 。” ”一 ~、 
是 采用 全 局 惟一 的 地 址 空间 。 同 样 ， 处 理 器 以 相同 的 图 12-12 图 12-2 多 处 理 器 中 的 
方式 访问 所 有 的 存储 器 。 但 是 ,访问 全 局 地 址 空间 中 一 个 处 理 器 节点 
的 本 地 存储 器 模块 所 用 时 间 要 少 于 对 远程 存储 器 模块 的 访问 时 间 。 








处 理 器 d 辅助 高 速 缓存 
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图 12-13 图 12-3 中 多 处 理 器 节点 结构 


图 12-4 的 结构 中 ， 每 个 处 理 器 只 可 以 直接 访问 它 自己 本 地 的 存储 器 。 这 样 ， 每 个 存储 器 模块 
为 处 理 器 建立 了 私有 地 址 空间 ， 而 没有 全 局 地 址 空间 。 任 何不 同 处 理 器 中 运行 的 程序 和 进程 之 
间 的 交互 都 是 通过 处 理 器 之 间 发 送 消息 来 实现 的 。 在 这 种 通信 方式 中 ， 每 个 处 理 器 将 相互 连接 
的 网 络 看 成 是 一 个 IO 设备 。 实 际 上 ， 在 这 样 的 系统 中 每 个 节点 都 可 以 看 作 单 处 理 器 计算 机 。 由 
于 这 个 原因 ， 这 类 系统 也 被 称 为 多 计算 机 系统 。 这 种 组 织 结构 为 能 将 一 些 计算 机 连 成 一 个 较 大 
系统 提供 了 最 简便 的 方式 。 由 于 信息 交换 需要 软件 的 干预 ， 所 以 运行 在 不 同 计算 机 中 的 任务 之 
间 的 通信 相对 来 说 要 慢 一 些 。 我 们 将 在 12.7 节 讨论 这 类 系统 。 

当 在 很 多 处 理 器 之 间 共 享 数据 时 ， 必 须 保证 对 于 一 个 给 定 的 数据 项 ， 所 有 处 理 器 所 看 到 的 
值 是 相同 的 。 在 一 个 共享 存储 器 系统 中 存在 有 许多 高 速 缓存 ， 因 此 在 这 一 点 上 出 现 了 问题 。 由 
于 在 不 同 的 高 速 缓 存 中 可 能 存在 一 些 数据 项 的 多 个 副本 ， 只 要 一 个 处 理 器 改变 ( 写 ) 自己 高 速 
缓存 中 的 数据 项 ， 那 么 同样 的 操作 必须 在 持 有 该 副本 的 所 有 高 速 缓存 中 进行 一 遍 。 另 一 种 选择 
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是 其 他 的 副本 必须 无 效 。 换 名 话说 ， 系 统 中 的 所 有 高 速 缓 存 的 共享 数据 必须 保持 一 致 。 保 持 高 
速 缓存 一 致 性 的 问题 有 几 种 不 同 的 解决 方案 。 我 们 将 在 12.6.2 节 中 讨论 最 流行 的 方案 。 


12.6 程序 并 行 性 与 共享 变量 


在 本 章 的 引言 中 靖 述 过 ， 将 一 个 大 的 任务 分 成 子 任务 并 在 多 处 理 器 上 并 行 执行 是 很 困难 的 。 
但 是 ， 在 一 些 比较 特殊 的 情况 下 ， 这 种 分 割 还 是 容易 的 。 如 果 -个 
大 任务 源 自 于 单独 程序 的 集合 ， 那 这 些 子 任务 可 以 很 方便 地 在 不 同 
的 处 理 跨 上 执行 。 除 非 因 竞争 公用 的 MO 设备 而 被 阻塞 ， 否 则 这 样 的 PASEAN 
工作 方式 会 充分 利用 多 处 理 器 。 Proel; 

另 一 种 情况 是 ， 当 高 级 程序 设计 语言 有 允许 应 用 程序 员 明 确 说 
明 在 程序 中 可 以 建立 并 行 执行 的 子 任务 这 一 结构 时 ， 这 种 情况 就 很 
容易 处 理 了 。 图 12-14 中 给 出 了 这 样 的 结构 ， 我 们 通常 把 这 种 结构 称 | paek ， 
为 PAR 段 。 这 里 采用 控制 语句 PARBEGIN 和 PAREND 将 可 以 并 行 执行 
的 部 分 Proc1 到 ProcK 括 起 来 。 这 个 程序 的 执行 顺序 如 下 : 当 
PARBEGIN 语 句 之 前 的 程序 段 完成 以 后 ，K 个 并 行程 序 根据 当前 可 用 一 
的 处 理 器 数目 ， 来 决定 执行 其 中 的 一 个 程序 乃至 全 部 的 程序 。 这 些 。 图 12.14 并 行程 序 结构 
程序 可 以 按照 任何 一 种 顺序 开始 。 程 序 中 PAREND 之 后 部 分 只 有 在 全 部 的 K 个 程序 处 理 完 之 后 才 
可 以 开始 执行 。 

如 果 在 多 处 理 器 中 只 有 一 个 程序 在 执行 ， 那 么 处 理 器 的 使 用 效率 就 取决 于 应 用 程序 员 了 ， 
PAR 段 的 并 行 度 K 以 及 相对 于 后 续 段 的 总 长 度 决定 了 多 处 理 器 利用 级 别 。 

为 了 提高 多 处 理 器 系统 利用 率 ， 最 具有 挑战 性 的 任务 是 开发 一个 可 以 在 用 户 程序 中 自动 检 
测 并 行 部 分 的 编译 器 。 自 动 检测 并 行 部 分 的 作用 是 基于 以 下 原因 的 。 应 用 程序 设计 人 员 很 自然 
的 想法 是 将 一 个 程序 看 成 是 一 个 串 行 操作 的 集合 。 然 而 ， 即 使 程序 员 指定 的 操作 是 用 某 种 高 级 
语言 编写 的 申 行 指令 序列 ， 但 仍 可 能 存在 一 些 可 以 并 行 执行 的 不 同 指 令 。 一 个 简单 的 例子 是 连 
续 的 循环 操作 。 如 果 在 循环 的 每 次 迄 代 之 间 没有 数据 的 依赖 关系 ， 那 么 可 以 并 行 执行 这 些 连 续 
的 操作 。 相 反 ， 如 果 第 一 遍 循 环 中 产生 的 数据 是 第 二 追 需要 的 ， 依 次 类 推 ， 那 么 就 不 能 进行 并 
行 处 理 。 编 译 器 必须 检测 出 数据 依赖 关系 并 决定 哪些 操作 是 可 以 并 行 执行 的 哪些 是 不 能 并 行 
执行 的 。 这 种 编译 器 的 设计 是 非常 复杂 的 。 即 使 程序 中 的 并 行 部 分 已 经 明确 ， 在 处 理 器 数量 有 
限 的 多 处 理 器 系统 中 对 其 调度 执行 也 是 很 艰巨 的 任务 。 调 度 可 以 由 编译 器 来 完成 ， 也 可 以 由 操 
作 系 统 在 运行 时 进行 处 理 。 我 们 不 深究 并 行 执行 中 的 决策 和 调度 任务 的 执行 过 程 ， 而 只 研究 在 
多 处 理 器 系统 中 不 同 处 理 器 并 行 运行 时 ， 程 序 是 怎样 来 修改 正在 访问 的 共享 变量 的 。 


12.6.1 共享 变量 访问 





假定 已 经 识别 出 在 多 处 理 器 上 可 以 并 行 运行 的 两 个 任务 。 这 两 个 任务 基本 上 是 独立 的 ,但 
是 它们 会 时 常 访问 和 修改 一 些 共享 的 全 局 内 存 变量 。 例 如 ， 共 享 变量 SUM 代 表 一 个 账目 的 余额 。 
此 外 再 假设 运行 在 几 个 不 同 处 理 器 上 的 任务 需要 修改 这 个 账目 。 每 个 任务 按照 如 下 方式 对 SUM 
进行 操作 : 读 取 SUM 的 当前 值 ， 根 据 这 个 值 执行 一 个 操作 ， 将 结果 写 回 到 SUM 中 。 如 果 分 别 在 
处 理 器 Pl1 和 P2 中 运行 的 两 个 任务 T1 和 T2 执 行 访问 SUM 的 读 - 修 改 - 写 操作 的 话 ， 很 容易 看 到 错误 
是 怎样 产生 的 。 假 定 T1 和 T2 从 SUM 读 取 当 前 值 ， 比 如 是 17， 然 后 继续 在 本 地 修改 。T1 加 5 结果 





是 22，T2 减 7 结果 是 10。 然 后 将 它们 的 结果 写 回 到 SUM，T2 先 写 ， Tl 后 写 。 现 在 变量 SUM 的 值 
是 22， 哪 个 错 了 呢 ?SUM 的 值 应 该 是 15 (=17+5-7)， 在 按照 严格 的 一 前 一 后 顺序 下 ， 修 改 后 的 
哪个 值 是 有 意义 的 呢 ? 

为 了 保证 对 共享 变量 SUM 进 行 正 确 的 操作 ， 每 个 任务 在 完成 读 - 修 改 - 写 序列 的 操作 期 间 必 
须 是 互 斥 访问 的 。 这 可 以 采用 全 局 镇 变量 LOCK 和 一 个 称 作 测试 - 置 位 (Test-and-Set) 的 指令 来 
实现 。 变 量 LOCK 有 两 个 值 0 或 1。 它 是 用 来 确保 在 执行 修改 该 共享 变量 所 需 的 时 间 内 ， 一 次 只 能 
有 一 个 任务 访问 SUM。 这 样 的 指令 序列 称 作 临 界 区 。LOCK 操 作 如 下 : 当 没 有 任务 进入 操作 
SUM 的 临界 区 时 ， 它 的 值 是 0。 当 任何 一 个 任务 想 要 修改 SUM 时 ， 它 首先 检查 LOCK 的 值 ， 然 后 
不 管 初始 值 是 什么 都 把 它 置 !。 如 果 初 始 值 是 0， 那 么 任务 可 以 很 安全 地 对 SUM 进 行 处 理 ， 因 为 
当前 没有 其 他 任务 进行 同样 的 操作 。 相 反 ， 如 果 LOCK 的 初始 值 是 1， 那 么 该 任 务 就 知道 其 他 任 
务 正 在 对 SUM 进 行 操作 。 在 它 能 够 继续 处 理 该 值 以 前 ， 必 须 等 待 直到 那个 任务 重新 设置 LOCK 为 
0。 这 种 想得到 对 LOCK 操 作 权 的 模式 可 以 通过 测试 ~ 置 位 指令 很 容易 地 实现 。 正 如 它 的 名 字 所 上 暗 
示 的 一 样 ， 这 条 指令 就 像 单一 的 指令 ， 作 为 一 条 不 可 分 割 的 操作 序列 来 执行 测试 和 置 位 LOCK 的 
关键 步 妊 。 当 这 条 指令 执行 时 ， 所 涉及 的 内 存 模块 不 能 响应 其 他 处 理 器 的 访问 请 求 。 


任务 Tl 任务 T2 


LOCK] TAS.B LOCKBYTE LOCK2 TAS.B LOCKBYTE 
BMI LOCKI 、 BMI LOCK2 


CLR.B LOCKBYTE CLR.B LOCKBYTE ° 





图 12-15 互 斥 访问 临界 区 


来 看 一 个 特殊 的 例子 ， 在 Motorola 68000 微 处 理 器 中 将 测试 - 置 位 指令 表示 成 TAS。 访 指令 
带 有 一 个 单字 节 的 操作 数 ， 假 定 存储 在 内 存 中 的 LOCKBYTE 处 ， 操 作 数 的 最 高 位 作为 刚刚 
讨论 过 的 锁 变 量 LOCK 使 用 。TAS 指 令 对 位 进行 不 可 中 断 的 测试 和 置 位 操作 。by 的 初始 值 设 
置 成 N〈 负 值 )，N 是 条 件 码 标志 。 这 样 ， 在 执行 完 TAS 以 后 ， 如 果 N 等 于 0 程序 可 以 继续 进入 到 
临界 区 ， 如 果 N 等 于 1 就 必须 等 待 。 图 12-15 给 出 了 两 个 任务 T1 和 T2 是 怎样 操作 LOCKBYTE 进 
人 修改 共享 变量 SUM 的 临界 区 代码 的 。TAS 指 令 后 面 跟着 条 件 转移 指令 。 如 果 N=1， 该 指令 就 
会 激活 回 到 TAS 的 转移 ， 并 在 操作 数 的 LOCKBYTE 处 重复 执行 一 个 等 待 循环 ， 直到 TAS 发 现 b 
等 于 0 为 止 。 如 果 执 行 TAS 时 by 是 9， 那么 转移 指令 失效 ， 于 是 允许 程序 继续 进入 临界 区 。 当 临 
界 区 执行 完毕 ， 清 除 LOCKBYTE。 这 样 b; 被 重新 复位 成 9， 于 是 允许 任何 等 待 的 程序 继续 进入 
临界 区 。 

TAS 指 令 是 一 个 可 以 实现 锁 的 简单 机 器 指令 的 例子 。 大 多 数 的 计算 机 中 都 包含 这 类 指令 。 这 
些 指令 还 可 以 提供 额外 的 功能 ， 例 如 将 检测 的 结果 与 一 个 条 件 转移 结合 起 来 。 
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12.6.2 高 速 缓存 一 致 性 


虽然 多 处 理 器 中 的 共享 数据 会 给 我 们 的 计算 带 来 方便 ,但 是 同时 也 会 带 来 另外 一 个 问题 ; 
具有 多 个 高 速 缓存 就 意味 着 在 几 个 高 速 缓存 中 保存 着 共享 数据 的 副本 。 当 任何 一 个 处 理 器 在 本 
地 的 高 速 缓存 中 对 共享 的 变量 进行 写 操作 时 ， 那 么 所 有 包含 该 变量 副本 的 高 速 缓存 中 的 值 就 会 
变 成 不 正确 的 值 。 所 以 这 一 更 改 必须 通知 相关 的 高 速 缓存 ， 这 些 副本 要 么 修改 为 新 值 ， 要 么 变 
为 无 效 。 高 速 缓存 一 致 性 是 对 这 种 情况 的 定义 ， 即 所 有 在 高 速 缓存 中 缓存 的 共享 数据 在 任何 时 
刻 都 应 保持 相同 。 

在 第 5 章 中 我 们 讨论 了 两 种 向 高 速 缓存 中 进行 写 操作 的 实现 方法 。 直 接 写 处 理 是 对 高 速 缓存 
和 主 存 同时 修改 。 写 回 处 理 只 改变 高 速 缓 在 中 的 数据 ， 主 存 中 的 副本 只 是 在 高 速 缓 存 中 的 脏 数 
据 块 必须 要 替换 时 才 进 行 修改 。 在 多 处 理 器 系统 中 也 采用 类 似 的 方法 。 

直接 写 协议 

直接 写 协议 的 实现 有 两 种 基本 版 本 。 一 种 是 修改 其 他 高 速 缓存 中 的 数值 ， 另 一 种 是 使 其 他 
高 速 缓存 中 的 副本 无 效 。 

我 们 先 来 看 一 下 带 有 更 新 的 直接 写 协议 。 当 处 理 器 向 高 速 缓 存 中 写 和 人 一 个 新 值 时 ， 这 个 新 
值 也 写 到 保存 该 高 速 缓存 值 的 内 存 块 中 。 由 于 这 个 块 在 其 他 高 速 缓 存 中 也 存在 ， 那 么 这 些 副 本 
也 要 同时 进行 修改 以 反映 出 由 该 写 操作 所 引起 的 变化 。 从 概念 上 来 讲 ， 最 简单 的 方法 是 向 系统 
中 的 所 有 处 理 器 广播 要 写 的 数据 。 当 每 个 处 理 器 接 到 这 个 广播 数据 时 ， 如 果 在 它 的 高 速 缓存 
( 主 或 从 高 速 缓存 ) 中 存在 这 个 受 影响 的 高 速 缓存 块 ， 那 么 就 修改 它 的 内 容 。 

直接 写 协议 的 第 二 个 版 本 是 使 副本 无 效 。 当 一 个 处 理 器 向 它 的 高 速 缓 在 中 写 人 一 个 新 值 时 ， 
这 个 值 被 写 到 内 存 中 ， 并 且 所 有 其 他 高 速 缓存 中 的 值 都 被 无 效 化 。 然 后 采用 广播 的 方式 向 系统 
中 发 送 无 效 化 请 求 。 

写 回 协议 

在 写 回 协议 中 ， 如 果 不 同 的 处 理 器 将 一 个 高 速 缓存 块 中 的 内 容 加 载 ( 读 ) 到 其 他 的 高 速 组 
存 中 ， 那 么 这 个 高 速 缓存 块 就 存在 着 多 个 副本 。 如 果 某 个 处 理 器 想 要 改变 这 个 块 ， 它 必须 首先 
要 成 为 这 个 块 的 独占 拥有 者 。 当 保存 这 个 内 存 模块 的 块 拥有 权 授 予 该 处 理 器 时 ， 那 么 所 有 其 他 
的 副本 ， 包 括 在 内 存 模块 中 的 副本 都 被 无 效 化 。 现 在 这 个 块 的 拥有 者 就 可 以 不 做 额外 操作 而 任 
意 修改 块 的 内 容 了 。 当 有 其 他 的 处 理 器 想 要 读 取 这 个 块 时 ， 就 由 当前 的 拥有 者 将 数据 传送 过 去 。 
那个 获得 包含 最 新 值 块 的 拥有 权 和 修改 权 的 所 有 者 ， 也 将 这 些 数据 传送 到 了 主 存 模 块 中 。 

写 回 协议 比 直接 写 协议 发 生 的 通信 量 少 ， 因 为 在 这 个 块 被 别 的 处 理 器 使 用 之 前 ， 该 处 理 器 
执行 了 若干 次 向 高 速 缓存 块 写 的 操作 。 

到 目前 为 止 ， 我 们 一 直 假定 这 些 协 议 中 的 修改 和 无 效 化 请 求 都 是 通过 互连网 络 来 广播 的 。 
实现 这 样 的 广播 是 否 可 行 ， 主 要 取决 于 所 采用 的 互连网 络 的 结构 。 在 12.4.1 节 中 讨论 过 的 单 总 线 
内 部 结构 特点 就 具备 这 种 支持 广播 能 力 的 网 络 。 在 使 用 单 总 线 的 小 型 多 处 理 器 系统 中 ， 高 速 组 
存 一 致 性 是 利用 监听 方法 来 实现 的 。 

监听 高 速 级 存 

在 单 总 线 系统 中 ， 处 理 器 和 存储 模块 之 间 的 全 部 交互 是 通过 总 线 完成 的 。 实 际 上 ， 它 们 是 
向 连接 在 总 线 上 的 所 有 单元 进行 广播 。 假 设 每 个 与 处 理 器 相连 的 高 速 组 存 都 有 一 个 控制 电路 ， 
该 电路 用 来 观察 在 这 条 连 有 其 他 处 理 器 的 总 线 上 进行 的 各 种 交互 动作 。 这 里 假定 采用 刚刚 描述 
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过 的 写 回 协议 。 

无 论 何 时 一 个 处 理 器 向 它 的 高 速 缓存 块 进行 第 一 次 写 人 ， 该 高 速 缓存 块 被 标注 为 脏 ， 并 且 
将 写 操作 在 总 线 上 进行 广播 。 内 存 模 块 和 所 有 其 他 高 速 缓存 将 它们 的 副本 变 成 无 效 。 于 是 ， 执 
行 写 操作 的 处 理 器 现在 就 成 为 该 高 速 缓存 块 的 拥有 者 。 它 可 以 继续 对 这 个 块 进行 写 操作 而 不 用 
将 其 广播 。 当 其 他 的 处 理 器 发 出 对 这 个 块 的 读 请 求 时 ， 因 为 内 存 模块 中 的 副本 是 无 效 的 ， 所 以 
内 存 不 能 做 出 响应 提供 需要 的 数据 。 但 是 当 这 个 请 求 出 现在 总 线 上 时 ， 该 数据 块 的 当前 所 有 者 
也 能 看 到 ， 这 时 所 有 者 必须 向 请 求 的 处 理 器 提供 正确 的 值 。 存 储 器 模块 得 知 一 个 所 有 者 正在 通 
过 广播 信号 来 传送 (包括 所 有 者 在 总 线 上 的 地 址 数据 ) 正确 值 ， 这 时 存储 器 模块 也 将 自身 的 值 
一 同 修改 。 最 后 ， 所 有 者 将 它 的 副本 标注 为 干净 。 此 时 ， 在 多 个 高 速 缓 存 块 和 存储 器 模块 中 的 
数据 都 是 正确 值 ， 于 是 操作 可 以 继续 进行 。 在 这 种 情况 下 ， 为 了 给 新 数据 腾 出 空间 ， 必 须 将 脏 
数据 替换 掉 ， 所 以 必须 对 存储 器 模块 执行 写 回 操作 。 

如 果 两 个 处 理 器 要 同时 向 相同 的 一 个 高 速 缓存 块 中 进行 写 操作 ， 其 中 之 一 将 被 授权 先 使 用 
总 线 并 成 为 所 有 者 。 另 一 个 处 理 器 中 的 高 速 缓存 块 的 副本 就 会 被 无 效 化 。 但 是 第 二 个 处 理 器 可 
以 重复 自己 的 写 请 求 。 这 样 ， 它 的 连续 写 请 求 可 以 保证 在 两 个 处 理 器 之 间 进行 通信 ， 以 此 来 保 
证 特定 高 速 缓存 块 中 不 同 的 数据 统一 成 正确 的 数据 。 

上 面 描述 的 方法 是 基于 高 速 缓存 控制 器 能 够 监视 总 线 上 的 动作 ， 并 可 以 采取 相应 的 控制 措 
施 的 能 力 。 我 们 称 这 种 方法 为 监听 高 速 比 存 技术 。 

出 于 对 性 能 的 考虑 ， 监 听 功 能 不 受 处 理 器 及 其 高 速 缓存 正常 操作 的 干扰 是 非常 重要 的 。 对 
于 总 线 上 的 每 个 请 求 ， 如 果 高 速 缓存 控制 器 都 要 访问 其 高 速 缓存 的 标志 位 来 确定 所 请 求 的 块 是 
否 在 它 的 高 速 缓 存 中 ， 便 会 产生 这 种 干扰 。 如 果 当 大 部 分 的 检测 块 都 不 在 它 的 高 速 缓存 中 时 ， 
这 种 干扰 是 不 必要 的 。 为 了 消除 这 种 不 必要 的 干扰 ， 每 个 高 速 缓存 提供 了 一 套 与 高 速 缓存 中 块 
信息 状态 相同 的 标志 信息 ， 用 这 些 标 志 可 以 探听 电路 上 单独 的 访问 。 

虽然 监听 高 速 缓存 的 概念 很 有 效 并 且 容 易 实现 ， 但 是 它 只 适用 于 单 总 线 系 统 。 在 大 规模 的 
多 处 理 器 系统 中 ， 必 须 采 用 更 加 复杂 的 结构 。 

基于 目录 的 方案 

采用 广播 机 制 来 发 送 无 效 化 和 修改 请 求 以 加 强 高速 缓 存 一 致 性 的 方法 ， 随 着 多 处 理 器 系统 
规模 的 扩大 而 逐渐 显得 力不从心 。 其 主要 原因 是 由 于 完全 的 广播 所 带 来 的 大 量 不 必要 的 信息 传 
输 ， 因 为 在 实际 的 应 用 中 ， 某 个 特定 块 的 副本 通常 只 存在 于 几 个 高 速 缓存 中 。 

非常 有 用 的 做 法 是 保存 一 个 位 置 目 录 ， 即 可 以 了 解 任何 时 刻 副 本 所 在 的 高 速 缓存 位 置 。 实 
现 这 种 方案 的 一 种 方式 是 在 一 个 特定 的 内 存 块 中 为 每 个 块 设置 额外 的 状态 位 ， 用 来 指向 这 个 块 
的 副本 在 哪些 高 速 缓存 中 。 然 后 ， 不 是 采用 前 面 的 方法 对 所 有 高 速 缓存 进行 广播 ， 而 是 内 存 模 
块 仅仅 向 具有 副本 的 高 速 缓存 发 送 单独 的 消息 ， 或 多 播 一 个 写 回 协议 的 无 效 化 请 求 。 当 然 ， 内 
存 块 中 的 附加 位 增加 了 这 些 模块 的 成 本 。 目 前 ， 已 经 提出 了 不 同 的 目录 方案 版 本 ， 并 且 其 中 一 
些 在 现存 的 多 处 理 器 系统 中 已 经 得 到 实现 。 

SCI 标 准 

电气 和 电子 工程 师 协会 (IEEE) 已 经 对 高 速 缓存 一 致 性 的 详细 实现 方法 制定 了 标准 。 该 标 
准 是 SCI (可 扩 缩 一 致 性 接口 ) 标准 9 中 的 一 部 分 ， 它 定义 了 多 处 理 器 底板 ， 该 底板 具备 的 特点 
是 : 可 以 提供 快速 的 信号 、 可 升级 的 体系 结构 、 高 速 缓存 一 致 性 并 且 实 现 简单 。 互 连 网 络 采用 
点 对 点 连接 ， 其 通信 协议 采用 单个 请 求 单个 响应 的 规则 。 源 节点 生成 的 一 个 信息 包 只 发 往 一 个 
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目标 地 址 。 如 果 目 标 节 点 接收 到 源 节 点 的 信息 包 ， 那 么 它 会 发 回 一 个 肯定 的 应 答 信息 包 。 如 果 
没有 收 到 这 个 信息 包 ， 就 会 发 回 一 个 否定 的 应 答 信息 包 ， 将 该 信息 包 重 新 发 送 。 

高 速 缓存 一 致 性 是 基于 分 布 式 目录 协议 实现 的 。 包 含 共 享 数据 的 每 个 高 速 缓存 块 都 有 一 个 
对 应 的 双 链 表 。 每 个 处 理 器 节点 可 以 缓存 共享 数据 块 ， 以 及 包括 指向 共享 块 的 前 一 节点 和 后 一 
节点 的 指针 。 这 些 指针 是 高 速 缓存 块 标记 的 一 部 分 。 这 个 双 链 表 的 表 头 指向 共享 数据 块 所 在 的 
内 存 块 。 当 有 一 个 新 节点 访问 内 存 来 读 取 这 个 块 时 ， 该 节点 就 成 为 链表 的 新 表 头 ， 同 时 要 改变 
内 存 目 录 ， 用 新 表 头 的 地 址 来 代替 先前 的 表 头 。 只 有 家 头 才 可 以 对 内 存 进行 写 访问 。 如 果 有 其 
他 节点 要 执行 写 操作 ， 可 以 将 该 节点 本 身 作 为 表 头 插入 表 中 ， 并 重新 调整 表 中 的 其 他 表 项 。 

SCI 的 高 速 缓存 一 致 性 方案 由 于 所 需 的 内 存 目 录 和 处 理 器 高 速 缓 存 标志 存储 不 会 随 着 链表 规 
模 的 增 大 而 增加 ， 所 以 具有 很 好 的 性 能 。 这 种 方案 的 一 个 缺点 是 在 任何 情况 下 ， 都 会 有 这 种 固 
定 的 额外 每 久 开 销 ， 所 以 代价 比较 高 。 

尽管 SCI 标 准 并 没有 为 互连网 络 指明 一 种 特定 的 拓扑 结构 ， 但 环 状 拓 扑 结 构 是 最 自然 的 选择 
之 一 。Hewlett-Packard 的 样机 V2600 和 Data General 的 AV25000 多 处 理 器 系统 就 采用 了 环 状 拓扑 结 
构 以 及 上 面 描述 的 一 致 性 协议 。 

CC-NUMA 多 处 理 器 

在 多 处 理 器 系统 中 的 高 速 缓存 一 致 性 是 一 个 重要 的 问题 。 它 已 经 成 为 广泛 研究 的 课题 。 我 
们 已 经 简要 描述 了 一 些 关 键 的 实现 方案 。 本 书 不 再 对 其 细节 进行 更 多 的 讨论 。 

多 处 理 器 可 以 通过 硬件 和 软件 的 方法 来 实现 高 速 缓存 一 致 性 。 从 性 能 上 来 看 ， 用 硬件 来 控 
制 高 速 缓存 一 致 性 更 有 优势 。 目 前 大 多 数 NUMA 多 处 理 器 是 采用 硬件 的 方式 来 实现 高 速 缓存 一 
致 性 的 ， 通 常 称 为 “高 速 缓 存 一 致 的 NUMA (CC-NUMA ) 系统 ”。 


12.6.3 加 锁 和 高 速 缓存 一 致 性 


我 们 应 该 注意 到 用 锁 来 保护 共享 变量 的 访问 是 与 高 速 缓存 一致 性 的 控制 相 独 立 的 ， 并 且 这 两 
类 控制 都 是 必需 的 。 考 虑 一 下 这 种 情况 ， 采 用 直接 写 策略 的 同时 还 修改 共享 变量 的 方式 来 保证 高 速 
缓存 的 一 致 性 。 假 定 12.6.1 节 例子 中 的 SUM 的 内 容 已 经 读 到 正在 执行 TI 和 T2 任 务 的 两 个 处 理 器 的 高 
速 缓存 中 。 如 果 读 操作 是 修改 序列 中 的 一 部 分 ， 并 且 没 有 用 锁 保护 控制 进行 互 斥 控制 ， 那 么 仍然 会 
产生 最 初 的 错误 。 如 果 像 以 前 一 样 ， 任 务 T1 最 后 写 它 的 新 值 ， 那 么 SUM 的 值 将 是 22， 仍 是 错 值 。 
在 整个 动作 期 间 一 直 都 保持 着 高 速 缓存 一 致 性 ， 却 因为 没有 采用 锁 保 护 控制 而 得 到 错误 的 结果 。 


12.7 多 计算 机 


”在 12.5 池 中 我 们 介绍 了 多 计算 机 系统 的 概念 。 现 在 详细 讨论 该 系统 的 显著 特征 。 

多 计算 机 系统 的 结构 如 图 12-4 所 示 。 系 统 中 的 每 个 处 理 节点 是 一 个 独立 的 计算 机 ， 它 们 可 以 
通过 在 网 络 中 发 送 消息 而 在 彼此 之 间 通 信 。 相 对 应 于 前 面 讨论 的 共享 存储 器 多 处 理 器 系统 而 言 ， 
这 类 系统 通常 称 为 消息 传递 系统 。 

在 多 计算 机 系统 中 ， 互 连 网 络 上 的 命令 不 像 在 共享 存储 器 多 处 理 器 系统 中 那样 迫切 。 共 享 
存储 器 系统 中 因为 处 理 器 模块 要 频繁 访问 远程 共享 内 存 模块 ， 所 以 必须 具有 很 高 带宽 的 快速 网 
络 。 如 果 采 用 慢 速 的 网 络 ， 那 么 网 络 本 身 很 快 就 会 变 成 瓶颈 而 使 系统 的 总 体 性 能 迅速 下 降 。 

在 多 计算 机 系统 中 ， 消 息 的 发 送 频率 远 远 低 于 共享 存储 器 多 处 理 器 系统 中 的 发 送 频率 ， 所 
以 系统 中 的 信息 流量 会 远 远 小 于 后 者 。 因 此 可 以 使 用 更 加 简单 和 成 本 更 低 的 网 络 。 从 不 同 的 通 
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12.4 节 中 描述 的 任何 网 络 都 可 以 用 于 多 计算 机 系统 中 . 由 于 需要 的 通信 量 相对 来 说 比较 适度 ， 
所 以 互连网 络 的 物理 实现 可 能 会 便宜 一 些 。 网 络 中 的 连接 经 常 包 括 由 IO 设备 接口 驱动 的 位 串 行 
线 。 接 口 电 路 通过 DMA 技 术 从 源 计算 机 的 内 存 中 读 取 一 个 消息 ， 将 它 转换 成 位 串 格式 ， 并 通过 
网 络 将 其 传送 到 目标 计算 机 中 。 源 地 址 和 目标 地 址 中 都 包含 用 作 路 由 的 信息 头 部 。 这 个 信息 被 
路 由 到 目标 计算 机 后 ， 通 过 该 机 的 1/O 接 口 将 其 写 到 内 存 缓冲 区 中 。 

基于 超 立 方 体 的 互连网 络 在 20 世 纪 80 年 代 非 常 流行 。 该 网 络 采 用 的 是 信息 传递 系统 ， 经 常 
使 用 位 串 进行 传输 。 这 种 机 器 的 例子 有 Intel 的 iPSC、NCUBE 的 NCUBRhenl 愉 及 Thinking Machines 
的 CM-2。 之 后 在 20 世 纪 90 年 代 早 期 ， 其 他 用 于 信息 传递 和 共享 存储 器 系统 的 拓扑 结构 逐渐 流行 


起 来 。Thinking Machines 的 CM-5 是 使 用 连接 宽度 为 4 的 胖 树 网 络 的 消息 传递 机 器 。Intel 的 Paragon 


采用 了 连接 宽度 为 16 的 网 状 网 络 。 为 了 方便 消息 的 传递 ， 在 网 络 中 的 每 个 节点 处 使 用 特殊 的 通 
信和 单元 。 例 如， 在 Paragon 机 器 中 有 一 个 消息 处 理 器 ， 它 实质 上 使 得 应 用 处 理 器 从 消息 处 理 的 细 
节 中 解放 出 来 。 


12.7.1 局 域 网 


因为 在 多 计算 机 系统 中 的 通信 要 求 相 对 来 说 低 一 些 ， 我 们 可 以 考虑 用 一 些 容易 获取 的 标准 
网 络 来 代替 专门 的 互连网 络 ， 这 些 标 准 网 络 是 为 了 更 一 般 的 通信 目的 而 开发 的 。 很 多 网 络 由 于 
可 以 连接 各 种 不 同类 型 的 计算 机 设备 而 存在 。 地 理 范 围 较 小 且 一 般 距 离 不 超过 几 公里 的 网 络 称 
为 局 域 网 【LAN )。 覆 盖 面 积 较 大 且 距 离 超过 几 千 公里 的 网 络 称 为 远程 网 或 广域网 。 

最 流行 的 LAN 采 用 总 线 或 环 状 拓扑 结构 。 这 两 种 局 域 网 的 传输 介质 可 以 是 双 绞 线 、 同 辆 电 
费 或 光纤 。 它 采用 位 串 方式 传输 ， 速 率 范围 从 每 秒 十 兆 到 几 百 兆 字 节 。 在 单条 共享 通路 上 每 次 
只 能 传输 一 个 信息 包 。 信 息 包 中 ， 源 和 目的 设备 地 址 在 数据 字段 之 前 ， 相 应 的 分 隔 符 用 来 指示 
信息 包 的 开始 和 结束 。 通 常 ， 信 息 包 的 长 度 是 可 变 的 ， 范 围 从 几 十 字 节 到 上 千 字 节 。 

实现 分 布 式 访问 控制 的 协议 需要 保证 在 任意 的 两 个 通信 设备 之 间 进 行 有 序 的 传送 。 我 们 将 
描述 两 种 广泛 采用 的 协议 一 -以 太 网 总 线 和 令 牌 环 。 这 些 协议 在 了 EEE 标 准 to 中 有 详细 的 说 明 。 


12.7.2 以 太 网 (CSMA/CD) 总 线 


”以 太 网 总 线 访问 协议 也 称 作 带 冲突 检测 的 载波 监听 多 路 访问 (CSMA/CD) 协议 ， 是 在 概念 
上 最 简单 的 协议 之 一 。 每 当 一 个 相连 的 设备 要 发 送 消息 时 ， 它 会 一 直 等 待 直到 总 线 空闲 的 时 候 
才 开 始 传输 。 然 后 该 设备 在 它 传送 消息 的 2r 秒 后 监视 总 线 ， 其 中 的 * 是 数据 在 总 线 上 从 -一端 到 另 
一 端的 传输 延迟 。 如 果 该 设备 在 2r 间隔 内 没有 发 现 自己 传输 信号 的 任何 失真 ， 那 么 就 认为 没有 
其 他 的 设备 进行 传输 ， 可 以 继续 传输 直到 结束 。 相 反 ， 如 果 发 现 了 由 其 他 设备 开始 传输 而 引起 
的 失真 ， 那 么 两 个 设备 都 停止 传输 。 两 个 传输 信号 之 间 的 相互 破坏 所 引起 的 失真 称 为 冲突 ， 时 
间 间 隔 25 称 为 冲突 富 口 。 

被 冲突 破坏 的 消息 必须 重 传 。 如 果 冲 突 中 所 包括 的 设备 立即 进行 重 传 ， 那 么 它们 的 信息 包 
很 可 能 再 次 冲突 。 防 止 重复 冲突 所 采用 的 基本 策略 如 下 : 每 个 单独 的 设备 等 待 一 个 随机 的 时 
间 ， 然 后 直到 总 线 空闲 才 开始 传输 。 如 果 随 机 等 待 时 间 是 2r 的 倍数 ， 那 么 重复 冲突 的 可 能 性 

会 降低 。 
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12.7.3 令 牌 环 


令 牌 环 协议 用 于 环 状 网 中 。 一 个 单独 的 进行 适当 编码 的 短 消息 称 为 令 牌 ， 它 在 环 上 连续 不 
断 地 循环 传送 。 令 牌 到 达 环 上 的 哪个 节点 ， 就 表示 人 允许 哪个 节点 进行 传输 。 如 果 该 节点 没有 任 
何 数 据 传输 ， 它 要 尽快 地 将 令 牌 传送 到 下 游 的 节点 。 如 果 该 节点 有 要 发 送 的 数据 ， 那 么 它 就 不 
传送 令 牌 。 相 反 它 会 传送 一 个 带 有 适当 头 部 编码 标志 的 信息 包 。 这 个 信息 包 在 环 上 传输 时 ， 当 
经 过 目的 节点 的 时 候 ， 它 的 内 容 就 被 目的 节点 读 取 并 复制 过 去 。 然 后 这 个 信息 包 还 继续 在 环 上 
传输 ， 直 到 回 到 源 节 点 之 后 被 丢弃 。 当 源 节 点 完成 了 一 个 信息 包 的 传输 之 后 ， 它 就 释放 令 牌 让 
其 在 环 上 继续 循环 传递 。 令 牌 环 上 的 信息 包 大 小 是 可 变 的 ， 因 为 目的 节点 必须 能 保存 整个 信息 
包 ， 所 以 只 受 每 个 节点 可 用 缓冲 区 空间 的 限制 。 , 

在 多 计算 机 系统 的 上 下 文中 考虑 标准 LAN 的 主要 原因 不 是 因为 它们 是 独立 系统 ， 而 是 因为 
可 以 利用 这 些 网 络 很 方便 地 将 标准 的 工作 站 连接 起 来 ， 形 成 多 计算 机 系统 。 


12.7.4 工作 站 网 络 


如 今 ， 大 多 数 商业 、 教 育 和 政府 机 构 为 了 满足 计算 的 需要 都 建 有 工作 站 。 这 些 工作 站 通常 
连接 到 LAN 上 ， 并 可 以 访问 文件 服务 器 、 打 印 机 和 专门 的 计算 资源 (参见 图 12-16)。 





| 以 太 网 





文件 服务 器 | 
图 12-16 典型 工作 站 网 络 


虽然 每 台 工作 站 通常 是 作为 单独 的 计算 机 来 使 用 ， 但 很 多 工作 站 可 以 看 作 是 一 个 多 计算 机 
系统 。 所 需要 的 就 是 进行 并 行 处 理 的 软件 。 当 然 ， 这 样 的 系统 和 商用 的 信息 传递 多 处 理 器 机 器 
之 间 还 存在 一 些 重要 的 区 别 ， 尤 其 是 通过 LAN 来 进行 通信 的 速度 很 慢 。 主 要 区 别 是 在 不 同 计算 
机 上 运行 的 程序 之 间 进 行 信息 交换 上 时， 必须 由 操作 系统 进行 干预 。 这 就 是 说 工作 站 网 络 不 能 像 
带 有 指定 互连网 络 的 独立 系统 那样 进行 工作 。 但 是 最 大 优点 是 这 种 工作 站 网 络 通常 可 以 随意 获 
得 。 当 然 ， 当 工作 站 不 是 作为 常规 目的 来 使 用 时 ， 可 以 在 这 样 的 系统 中 运行 很 大 的 应 用 程序 ， 
一 般 这 种 工作 在 晚上 进行 。 


12.8 共享 存储 器 和 消息 传递 实例 


在 前 面 几 节 中 ， 我们 考虑 的 是 具有 共享 存储 器 和 消息 传递 特征 的 多 处 理 器 系统 的 硬件 含义 。 
现在 来 简要 说 明 一 下 这 些 特 征 是 如 何 影响 用 户 (实现 并 行 应 用 程序 的 程序 员 ) 的 。 考 虑 一 个 只 
有 两 个 处 理 器 的 简单 例子 。 这 样 可 以 简化 讨论 并 且 能 够 说 明 主 要 问题 。 

假定 要 计算 两 个 N 元 素 向 量 的 点 积 。 图 12-17 给 出 了 这 个 任务 的 串 行 程序 。 该 程序 很 适 于 在 
单 处 理 器 上 运行 。 程 序 中 的 大 部 分 是 自 解释 的 。Read 说 明 将 两 个 向 量 从 磁盘 (或 其 他 的 IO 设备 ) 
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两 个 元 素 的 乘积 ， 然 后 将 其 结果 与 先前 累计 部 分 的 点 积 相 加 。 

12.8.1 共享 存储 器 实例 


如 图 12-18 所 示 ， 我 们 先 试图 向 两 个 处 理 器 中 写 人 一 个 程序 。 当 程序 在 一 个 处 理 器 中 开始 执 
行 时 ， 它 将 向 量 装 入 内 存 并 将 变量 dot_product 初 始 化 为 0。 我 们 通过 第 二 个 处 理 器 执行 其 中 一 半 
的 计算 并 产生 所 需 的 点 积 。 它 通过 生成 单独 的 线程 在 另 一 个 处 理 器 上 运行 。 


Lo 
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integer array a[1..N], b[1..NJ 
integer dot product 


read all..N] from vector _a 
read b[1l..JN] from vector b 
dot_product := 0 

do.dot (a, b) 

print dot -product 


do_dot (integer array x[1..N], integer array y[1..N]) 
for k:= lto N 
dot -product := dot. product + x[k] * y[k] 
end 





图 12-17 计算 点 积 的 串 行程 序 


shared integer array a[1..N], b[1..N] 
shared integer dot product 

shared lock dot product Jock 

shared barrier done 


read a[l..N] from vector _a 
read b[1..N] from vector b 
dot -product := 0 

create thread (do. dot, a, b) 
do_dot (a, b) 

print dot product 


do_dot (integer array x[1..N], integer array y[1..N]) 
private integer id 
id := mypidO 
for k:= (id*N/2) + lto (id + 1*N/2 
lock (dot -product lock) 
dot -product := dot product + x[k] * y[k] 
unlock (dot „product lock) 


end 
barrier (done) 





图 12-18 在 共享 存储 器 机 器 的 两 个 处 理 器 上 计算 点 积 程序 的 首次 尝试 
线程 是 程序 内 部 的 一 条 独立 的 执行 路 径 。 实 际 上 ， 这 里 的 线程 是 指 执行 程序 的 多 线程 中 的 
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控制 线程 ， 这 些 线程 就 像 是 单独 的 程序 一 样 可 以 并 行 运行 。 这 样 、 在 不 同 的 处 理 器 上 可 以 运行 
两 个 或 两 个 以 上 的 线程 ， 并 且 这 些 线程 可 以 执行 相同 或 不 同 的 代码 。 关 键 一 点 是 所 有 的 线程 都 
是 单个 程序 中 的 一 部 分 ， 并 且 运行 在 相同 的 地 址 空间 上 。 我 们 应 该 注意 到 在 平常 的 单 处 理 器 环 
境 下 ， 每 个 程序 只 有 一 个 控制 线程 。 

图 12-18 中 的 程序 通过 create thread 语句 来 生成 一 个 新 的 线程 。 该 线程 在 执行 do_dot 程 序 之 后 就 
结束 。 操 作 系统 将 为 新 线程 分 配 一 个 标识 号 1。 第 一 个 处 理 器 作为 线程 0 继续 执行 do_dot (a, b) 语 句 。 
语句 id := mypid( ) 用 分 配 的 线程 标识 号 来 设置 变量 id。 在 for 循 环 中 利用 id 值 可 以 简化 说 明 向 量 a 和 
向 量 b 哪 个 应 该 用 特殊 的 线程 进行 管理 。 

由 于 不 断 改变 dot_product 变 量 的 累加 值 在 do_dot 程 序 中 是 临界 区 ， 因 此 ， 每 个 线程 必须 互 斥 
访问 这 个 变量 。 这 可 以 用 12.6.1 节 中 讨论 的 加 锁 机 制 来 实现 。 线 程 0 不 能 通过 do_dot 程 序 中 的 屏蔽 
语句 ， 直 到 其 他 线程 也 到 达 该 同步 点 。 这 就 保证 了 在 线程 0 输出 最 终结 果 之 前 ， 两 个 线程 都 已 经 
完成 了 。 屏 项 的 概念 可 以 通过 不 同 的 方式 来 实现 。 最 简单 的 方法 是 利用 一 个 共享 变量 ， 正 如 图 
12-18 中 的 一 样 。 该 变量 初始 化 为 线程 数 (在 本 例 中 是 2 )， 之 后 在 每 个 线程 到 达 屏 项 点 时 增 1。 

图 12-18 中 的 程序 有 一 个 主要 的 缺点 。 所 采用 的 加 锁 机 制 并 没有 实现 所 期 望 的 并 行 操 作 ， 因 
为 两 个 线程 可 以 向 相同 的 共享 变量 dot_product 进 行 连续 的 写 操作 。 这 样 ， 所 需 计 算 中 潜在 的 并 行 
部 分 实际 上 是 串 行 处 理 的 。 

为 了 达到 所 需 的 并 行 ， 我 们 可 以 像 图 12-19 中 那样 进行 修改 。 不 是 采用 共享 变量 dot_product， 
而 是 在 for 循 环 中 采用 私有 变量 local_dot_product， 在 每 个 线程 执行 期 间 来 累计 点 积 。 这 样 ， 只 是 
在 循环 结束 时 才 需 要 更 新 共享 变量 ， 即 进入 dot_product 的 临界 区 。 这 样 修改 就 允许 两 个 线程 并 行 
执行 for 循 环 。 

shared integer array all..N}), bll.N] 
shared integer dot product 


shared lock dot_product lock 
shared barrier done 


read a[l..N] from vector -a 
read b[1..N] from vector b 
dot -product := 0 

create _thread (do dot, a, b) 
dodot (a, b) 

print dot_product 


do-dot (integer array x[1..N], integer array y[1.N]) 

private integer local dot. product 

private integer id 

id := mypidO 

local_dot „product := 0 

for k:= Gd*N/2) + Ito (id + 1)*N/2 
local_dot_product := local dot. product + x[k] * y[k] 

end 

łock (dot _-product lock) 
dot product := dot product + local dot product 

unlock (dot _product Jock) 

barrier (done) 





图 12-19 在 共享 存储 器 机 器 的 两 个 处 理 器 上 计算 点 积 的 高 将 程序 





这 个 例子 很 容易 扩展 并 使 用 更 多 的 处 理 器 。 需 要 做 的 只 是 增加 线程 数量 即 可 。EFer 人 循环 的 循 
环 条 件 表达 式 决 定 基于 分 配 的 id 值 的 计算 中 每 个 线程 使 用 的 元 素 范 围 。 

图 12-19 中 程序 的 效果 依赖 于 数据 向 量 的 大 小 。 向 量 越 大 ， 这 种 方法 的 效果 就 越 好 。 对 于 小 
的 向 量 ， 创 建 线程 和 提供 同步 的 总 开销 往往 会 超过 并 行 处 理 所 带 来 的 好 处 。 


12.8.2 消息 传递 实例 


在 这 个 例子 中 内 存 是 分 布 式 的 ， 每 个 处 理 器 都 只 能 直接 访问 自己 的 内 存 。 所 需 的 程序 将 在 
两 个 处 理 器 上 和 运行， 并且 明确 地 将 数组 分 成 两 半 ， 每 一 半 将 分 别 存储 在 每 一 个 处 理 器 的 内 存 中 。 
程序 的 每 个 副本 将 只 访问 它 自己 的 数据 。 这 类 应 用 称 为 单程 序 多 数据 (SPMD )。 读 者 应 该 注意 
到 这 类 应 用 和 12.1.1 节 中 介绍 的 SIMD 类 型 之 间 的 不 同 。SIMD 类 型 中 ， 所 有 的 处 理 器 在 任何 时 刻 
都 执行 相同 的 指令 。 

图 12-20 中 给 出 了 一 个 可 能 的 程序 。 向 量 数据 必须 首先 载 入 两 个 处 理 器 的 专 有 内 存 中 。id 值 为 0 
的 程序 在 操作 系统 的 协助 下 从 磁盘 上 读 取向 量 a 的 前 一 半 ， 并 将 数据 以 相同 的 名 字 存 储 在 它 的 内 存 
中 。 然 后 它 读 取 向 量 a 剩余 的 一 半 ， 并 将 其 放 到 称 为 “temparray” 的 内 存 缓冲 区 中 。 下 一 步 它 就 向 
id 值 为 1 的 执行 该 程序 的 处 理 器 发 送 缓冲 区 数据 的 消息 。 向 量 b 中 的 数据 也 重复 同样 的 操作 。id 值 为 
1 的 程序 接收 到 向 量 a 和 向 量 b 的 后 一 半数 据 ， 然 后 将 它们 以 相同 的 名 字 存 储 在 各 自 的 内 存 中 。 


integer array a[1..N/2], b[1..N/2], temparray[1..N/2] 
integer dot -product 

integer id 

integer temp 


id := mypidO 
if (id = 0) then 
read all..N/2] from vector_a 
read temparray[1..N/2} from vector_a 
send (temparray[1..N/2], 1) 
read b[1..N/2] from vector.b 
read temparray[1..N/2] from vector_b 
send (temparray[1..N/2], 1) 
else receive (a[1..N/2), © 
receive (b[1..N/2], 0) 
end 
dot -product := 0 
do_ dot (a, b) 
让 (id = 1) send (dot product, 0) 
else receive (temp, 1) 
dot -product := dot product + temp 
print dot _product 
end 


do dot (integer array x|1..N/2], integer array y[1..N/2]) 
for k:= 1 to N/2 
dot -product := dot product + x[k] * y[k] 
end 
end 





图 12-20 在 两 个 处 理 器 上 计算 点 积 的 消息 传递 程序 
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现在 do-dot 程 序 只 是 计算 N/2 元 素 的 点 积 。 注 意 循环 的 条 件 对 于 两 个 处 理 器 来 说 是 相同 的 ， 
因为 每 个 处 理 器 使 用 的 数据 都 存在 自己 的 内 存 中 。 消 息 传递 通过 处 理 器 完成 do_dot 程 序 的 执行 时 
所 采取 的 动作 来 说 明 : id 值 为 0 的 程序 将 计算 和 显示 最 终 的 点 积 。 当 该 程序 接收 到 由 程序 1 发 来 的 
带 有 部 分 点 积 值 的 消息 时 ， 就 完成 这 两 步 操作 。 程 序 0 将 接收 到 的 这 个 值 放 到 称 为 tmp 的 缓冲 区 
中 。 

此 外 ， 很 容易 看 出 该 例子 也 能 扩充 并 使 用 更 多 的 处 理 器 。 这 时 ， 向 量 将 分 成 相应 的 份 数 以 
便 分 配给 每 个 处 理 器 进行 计算 。 处 理 器 之 一 ， 例 如 执行 ia=0 的 程序 的 处 理 器 ， 被 指定 用 其 他 处 理 
器 发 送 过 来 的 数据 计算 最 终结 果 。 

在 多 处 理 器 上 建立 并 行 处 理 的 总 开销 由 将 程序 载 人 不 同 处 理 器 所 需 的 时 间 、 根 据 不 同 的 处 
理 器 相关 的 内 存 中 划分 出 相应 的 数组 所 用 的 时 间 ， 以 及 在 处 理 器 之 间 传 送 其 他 信息 所 用 的 时 间 
构成 。 它 的 性 能 优势 依赖 于 向 量 的 大 小 和 所 使 用 的 处 理 器 数 。 

共享 存储 器 和 消息 传递 范例 都 有 一 定 的 优 缺 点 。 共 享 存储 器 环境 使 用 起 来 更 自然 ， 因 为 它 
是 单一 处 理 器 程序 模式 的 一 个 扩展 ， 可 以 更 容易 编写 出 高 效 的 并 行程 序 。 如 果 数 据 驻 留 在 远 
程 存储 器 模块 中 ， 访 问 延迟 可 能 会 很 明显 ， 最 好 把 对 全 局 变量 的 写 访问 降 到 最 小 。 网 络 的 通 
信 重 很 可 能 会 致使 网 络 成 为 瓶颈 。 过程 同 步 是 程序 员 的 任务 ， 它 会 对 应 用 的 性 能 产生 很 大 的 
影响 。 

由 于 私有 内 存 中 地 址 空间 的 不 同 ， 消 息 传递 所 提供 的 编程 环境 不 是 很 自然 。 消 息 传递 的 时 
间 开 销 是 非常 重要 的 ， 因 此 程序 员 必 须 尽力 使 程序 具有 良好 的 结构 ， 以 便 减 小 时 间 开 销 。 由 于 
消息 传递 的 频繁 度 不 高 ， 互 连 网 络 不 可 能 成 为 问题 。 在 处 理 器 之 间 的 消息 传递 中 隐 含 着 同步 操 
作 。 也 许 消息 传递 的 最 大 优势 就 在 于 更 加 廉价 以 及 硬件 更 容易 获得 这 两 个 方面 。 


12.9 性 能 因素 


本 章 的 重点 放 在 为 了 降低 运行 一 个 大 的 应 用 所 需 的 时 间 而 采用 的 多 处 理 器 系统 的 设计 。 性 
能 度量 的 最 重要 方式 是 可 获得 的 加 速 ， 即 对 一 个 多 处 理 器 系统 和 单 处 理 器 运行 同一 个 应 用 所 用 
的 时 间 进 行 比较 。 加 速 的 定义 是 
5 - 工 
T, 
其 中 Ti 和 Ts 分 别 表示 使 用 一 个 处 理 器 和 使 用 P 个 处 理 器 时 所 需 的 时 间 。 图 12-21 中 给 出 了 当 将 系统 
处 理 器 数 看 作 -个 函数 时 ， 可 能 出 现 的 三 类 加 速 情况 。 直 观 上 来 讲 ， 我 们 希望 随 着 处 理 器 数量 
的 增加 ， 并 行 处 理 一 个 应 用 所 需 的 时 间 应 读 相 应 地 减少 。 这 应 该 是 一 个 线性 加 速 ， 即 $ = P， 这 
也 是 可 扩 缩 系统 的 目标 。 不 幸 的 是 这 个 目标 实现 起 来 并 不 容易 。 
正如 上 一 节 讨 论 的 ， 一 个 应 用 程序 中 不 可 能 每 个 部 分 都 可 以 并 行 处 理 的 。 程 序 中 串 行 执行 
的 部 分 所 用 的 时 间 是 相同 的 ， 与 使 用 的 处 理 器 数 没有 关系 。 正 是 这 些 串 行 执 行 的 部 分 限制 了 相 
应 的 加 速 部 分 。 
无 法 达到 线性 加 速 的 另 一 原因 是 由 初始 化 、 同 步 、 通 信 、 高 速 缓存 一 致 性 以 及 加 载 不 平衡 
等 因素 所 带 来 的 过 高 的 系统 开销 。 系 统 开销 往往 会 增加 系统 的 规模 。 我 们 在 前 面 章节 中 过 到 的 
系统 开销 的 例子 中 不 包括 加 载 不 平衡 。 通 常 必须 等 待 最 后 一 个 处 理 器 完成 之 后 才 处 理 下 一 批 任 
务 。 因 此 ， 当 一 个 并 行 任务 分 布 在 多 个 处 理 器 中 的 时 候 ， 如 果 所 有 处 理 器 同时 到 达 给 定 同步 点 
时 效率 是 最 高 的 ， 这 时 候 加 载 也 是 平衡 的 。 
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图 12-21 多 处 理 器 系统 的 加 速 曲线 


实际 系统 中 大 多 数 应 用 可 获得 的 加 速 是 亚 线性 的 ， 并 且 处 理 器 的 个 数 达 到 一 定数 量 时 ， 性 
能 便 不 再 提高 了 。 有 一 些 奇怪 的 现象 ， 在 一 些 应 用 中 的 加 速 是 超 线 性 的 ， 但 是 这 种 情况 并 不 常 
见 。 我 们 在 后 续 章 节 中 给 出 一 个 这 种 应 用 的 例子 。 


12.9.1 Amdahl 定 律 


下 面 从 定量 的 角度 来 分 析 所 带 来 的 性 能 提高 。 一 个 计算 机 系统 性 能 的 提高 将 改善 系统 的 一 
部 分 ， 并 不 是 改善 整个 系统 。 提 高 的 性 能 依赖 于 改善 部 分 所 带 来 的 影响 。 这 个 原理 被 Gene 
Amdahl 用 著名 的 定律 "公式 化 了 。 其 形式 为 
Old time 1 


S = ——— T< — 
new ` 
New time 1- fspanced + Jaana / Dnanced 





式 中 : 
So 是 新 系统 中 的 加 速 ， 其 中 包含 改善 部 分 ; 
Somanes 是 系统 中 改善 部 分 所 带 来 的 加 速 ; 
frrarced 是 原 系 统 中 改善 部 分 所 提高 的 计算 时 间 。 
在 多 处 理 器 系统 中 ， 该 定律 可 以 按照 以 下 方式 重新 叙述 。f 表示 可 并 行 计算 的 部 分 (时间 形 
式 )，P 是 系统 中 处 理 器 的 数量 ，5p 是 相对 于 申 行 执行 时 可 获得 的 加 速 。 那 么 ， 我 们 得 到 : 
se 1 _ P 
? I-f+f/P P-FP-D 
该 公式 假定 全 部 处 理 器 使 用 的 都 是 平衡 加 载 条 件 下 的 并 行 部 分 。 
假定 一 个 给 定 的 应 用 运行 在 64 处 理 器 的 机 器 上 ， 并 且 应 用 中 70% 是 可 并 行 化 的 ， 那 么 可 得 
到 的 加 速 是 


64 3.22 


Su =— —-3. 
“ 64-07x63 
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如 果 同 样 的 应 用 程序 运行 在 16 处 理 器 的 机 器 上 ， 可 得 到 的 加 速 将 是 2.91。 这 说 明了 加 速 部 分 远 远 
小 于 机 器 中 处 理 器 的 数量 。 此 外 ， 从 16 个 处 理 器 增加 到 64 个 处 理 器 所 带 来 的 加 速 之 间 的 差别 是 
甚 微 的 。 显然 ， 对 于 绝 大 部 分 是 串 行 执行 (GEF) 的 应 用 来 说 ， 使 用 大 规模 多 处 理 器 系统 几 
乎 是 没有 意义 的 。 为 了 得 到 更 高 的 加 速 ， 必 须 将 串 行 部 分 变 短 。 对 于 /= 0.95 的 应 用 来 说 ， 在 上 
述 两 个 机 器 中 可 获得 的 加 速 分 别 是 15.42 和 9.14。 实 际 上 ，Amdahl 定 律 说 明 的 是 几乎 所 有 的 应 用 
中 都 有 一 定 的 不 可 并 行 部 分 ， 因 此 不 可 能 获得 线性 加 速 。 

这 个 讨论 假设 每 个 处 理 器 都 执行 相同 数量 的 并 行 计算 。 这 样 相同 的 平衡 加 载 是 不 可 能 发 生 
的 。 如 果 在 执行 下 一 步 操作 之 前 必须 等 待 最 慢 的 处 理 器 完成 它 的 并 行 任务 ， 那 么 利用 上 面 的 公 
式 计算 的 结果 要 比 预 期 的 更 精 。 然 而 ， 存 在 会 出 现 反面 结果 的 应 用 ， 也 就 是 只 要 有 一 个 处 理 器 
完成 了 它 的 任务 ， 那 么 所 有 处 理 器 执行 的 任务 都 将 终止 。 例 如 ， 这 样 的 异常 行为 发 生 在 基于 一 
种 称 为 “模拟 退火 ”技术 的 应 用 中 。 为 了 说 明 这 种 技术 ， 假 定 在 VLSI 芯片 的 设计 中 ， 希 望 在 芯 
片上 安放 逻辑 门 ， 这 些 门 的 导线 总 长 度 将 决定 电路 是 否 能 够 达到 最 小 。 这 就 需要 尝试 大 量 不 同 
方式 的 布局 方案 ， 以 便 实现 最 佳 的 布局 ， 使 全 部 处 理 器 在 同一 时 刻 到 达 下 一 迭代 的 起 始点 。 那 
么 每 个 处 理 器 就 用 不 同 的 随机 方法 来 改变 逻辑 门 的 位 置 以 寻求 最 佳 布局 。 只 要 一 个 处 理 器 找到 
了 一 种 比 预先 起 始点 都 好 的 位 置 ， 该 位 置 就 用 作 所 有 处 理 器 的 新 起 点 ， 而 不 必 等 待 其 他 处 理 器 
也 去 寻找 。 这 类 应 用 展示 了 超 线性 的 加 速 ， 因 为 在 用 单 处 理 器 处 理 时 ， 在 得 到 一 个 较 好 的 位 置 
之 前 ， 有 大 量 的 时 间 浪 费 在 尝试 那些 不 可 能 的 情况 上 。 


12.9.2 性 能 指标 


从 用 户 的 角度 来 看 ， 一 个 计算 机 系统 最 重要 的 特点 是 它 的 成 本 、 易 用 性 、 可 靠 性 和 性 能 。 
性 能 指标 用 来 描述 计算 机 的 处 理 能 力 。8.8 节 中 所 讨论 的 问题 也 适用 于 多 处 理 器 系统 。 

处 理 器 的 原始 能 力 是 通过 一 秒 钟 所 能 进行 操作 的 数量 来 描述 的 。 两 种 比较 流行 的 度量 标准 
是 MIPS (每 秒 钟 执行 指令 的 百 万 条 数 ) 和 MFLOPS (每 秒 钟 执行 浮 点 计算 的 百 万 条 数 )。 生 产 商 
为 特定 处 理 器 给 出 了 相应 的 MIPS 和 MFLOPS 值 ， 这 些 数字 表示 的 是 处 理 器 的 最 大 处 理 能 力 。 实 
际 中 这 个 最 大 能 力 是 达 不 到 的 。 在 多 处 理 器 系统 中 ， 总 的 MIPS 和 MFLOPS 是 系统 中 所 有 处 理 器 
相应 值 的 总 和 。 

另 一 个 常用 性 能 指标 是 互连网 络 的 通信 能 力 ， 通 常 以 每 秒 字 节 数 的 形式 给 出 带宽 。 这 是 假 
定 在 最 理想 的 情况 下 ， 即 网 络 中 有 足够 的 传输 数据 ， 可 以 保持 网 络 中 的 数据 传输 处 于 最 大 的 传 
输 状态 。 这 样 可 以 使 得 每 次 传送 的 数据 能 够 达到 最 大 。 

虽然 MIPS、MFLOPS 和 网 络 带 宽 这 些 指标 对 了 解 系统 处 理 能 力 是 有 用 的 ， 但 是 ， 它 们 并 不 
能 度量 应 用 程序 在 执行 时 我 们 所 要 观察 的 性 能 。 实 际 应 用 在 任何 指定 的 时 刻 只 能 使 用 总 资源 中 
的 一 部 分 。 这 部 分 性 能 会 随 着 系统 与 系统 的 不 同 以 及 应 用 与 应 用 之 间 的 不 同 而 变化 。 两 个 不 同 
系统 之 间 的 适当 比较 只 能 通过 一 套 应 用 程序 在 两 个 系统 中 同时 运行 来 观察 它们 的 性 能 。 为 了 满 
足 这 种 需要 ， 基 准 程序 应 运 而 生 。 这 些 程序 可 以 表示 普通 应 用 中 的 各 种 各 样 的 行为 。 目 前 已 经 
普遍 采用 基准 程序 进行 系统 间 的 性 能 比较 。 


12.10 结束 语 


多 处 理 器 系统 以 合理 的 成 本 提供 了 巨型 机 计算 能 力 的 实现 途径 。 它 们 在 几 十 个 处 理 器 到 上 
干 个 处 理 器 的 范围 内 是 最 有 效 的 实现 方案 。 由 几 千 个 处 理 器 构成 的 超大 规模 系统 很 难 充 分 利用 ， 
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同时 由 于 其 价格 原因 而 使 市 场 需求 大 大 减少 。 

实现 多 计算 机 系统 的 一 种 有 效 方法 是 采用 局 域 网 将 工作 站 互 连 起 来 构成 一 个 系统 。 这 种 方 ”[659] 
法 随 着 局 域 网 速度 的 提高 逐渐 变 得 更 具 吸 引力 。 

多 处 理 器 的 成 功 使 用 很 大 程度 上 依赖 于 能 充分 使 用 系统 资源 的 系统 软件 。 如 果 一 个 应 用 程 
序 本 身 中 没有 适当 使 用 局 部 性 原理 和 并 行 机 制 ， 那 么 它 就 不 会 表现 出 良好 的 性 能 。 编 译 器 必须 
能 检测 出 程序 中 可 以 并 行 处 理 的 程序 段 。 同 时 ， 操 作 系 统 对 系统 中 相 邻 处 理 器 之 间 的 大 量 交互 ， 
要 充分 利用 局 部 性 原理 来 调度 执行 。 应 用 程序 员 应 该 对 这 方面 提供 有 用 的 线索 ， 不 过 最 好 还 是 
由 操作 系统 本 身 来 完成 这 部 分 工作 。 

本 章 主要 对 多 处 理 器 系统 和 多 计算 机 系统 的 最 重要 特征 作 了 总 体 上 的 描述 . 读者 需要 学 习 
更 多 的 细节 ， 才 能 充分 理解 这 些 系统 的 各 种 功能 和 所 涉及 的 设计 问题 。 如 果 您 想 学 习 更 多 的 内 
容 ， 可 以 参考 这 方面 主题 41 中 的 书籍 。 


12.1 编写 一 个 循环 程序 ， 可 以 使 图 12-1 中 的 控制 处 理 器 进行 指令 的 广播 ， 并 能 使 一 组 处 理 器 重 
复 计算 12.2 节 中 讨论 的 平面 的 温度 。 除 了 相 邻 处 理 单元 (PE) 之 间 转 换 网 络 寄 存 器 内 容 的 
指令 以 外 ， 我 们 假定 有 双 操 作 数 指令 用 于 PE 寄存 器 和 本 地 内 存 之 间 ， 传 送 数据 并 进行 算术 
运算 。 另 外 假定 每 个 PE 保存 着 它 本 地 内 存 CURRENT 处 的 网 格 点 温度 和 R0、R1L 等 几 个 处 理 
中 使 用 的 寄存 器 。 每 个 边界 PE 维持 一 个 固定 的 网 络 寄存 器 中 的 边界 温度 值 ， 并 且 不 执行 程 
序 广播 。 在 每 个 PE 的 EPSILON 位 置 中 存储 一 个 很 小 的 数值 ， 是 用 来 判断 局 部 温度 是 否 已 经 
达到 所 需 的 精确 级 别 。 在 循环 每 次 进 代 的 末尾 ， 每 个 PE 必须 设置 状态 位 STATUS。 如 果 新 
温度 满足 下 面 的 条 件 : 

INew temperature - [CURRENT]I < [EPSILON] 
STATUS 设 置 成 1; 否则 ，STATUS 设 置 成 0。 

12.2 假定 总 线 传输 需要 T 秒 ， 内 存 访问 时 间 需 要 4 条 秒 。 一 个 经 过 传统 总 线 的 读 请 求 需要 67 秒 完 
成 。 在 相同 的 时 间 延 迟 下 ， 需 要 多 少 根 传统 的 总 线 才 能 等 于 或 超过 一 个 分 割 事务 总 线 的 带 
宽 ? 只 考虑 读 请 求 ， 忽 略 内 存 冲突 并 假定 所 有 的 内 存 模 块 都 连接 到 多 总 线 中 的 所 有 总 线 上 。 
如 果 内 存 访 问 时 间 增 加 的 话 ， 你 的 答案 是 增加 还 是 减少 ? 

12.3 在 基于 总 线 的 多 处 理 器 中 ， 如 果 系 统 总 线 不 支持 足够 高 的 传输 速率 ， 它 会 成 为 一 个 瓶颈 。 [657 
假定 一 个 分 割 事务 总 线 的 宽度 设计 为 系统 处 理 器 字 长 的 四 倍 。 如 果 有 效 的 传输 率 增加 ， 它 
的 速度 是 否 能 增加 到 带宽 与 单 处 理 器 字 长 相同 的 总 线 的 四 倍 ?说明 你 的 理由 。 

12.4 假定 在 混 洗 网 中 2 x 2 开关 的 成 本 是 交叉 开关 成 本 的 两 倍 。 在 n x n 交 又 开关 中 有 个 交叉 点 。 
随 着 ?的 增加 ， 交 叉 开 关 要 比 混 洗 网 更 加 昂贵 。 当 交叉 开关 成 本 是 混 洗 网 的 五 倍 时 ，x 最 小 
是 多 少 ? 

12.5 混 洗 网 可 以 不 用 2 x 2 的 开关 ， 而 采用 如 4 x 4 和 8 x 8 的 开关 构成 。 画 出 一 个 用 4 x 4 开关 构成 
的 16 x 16 (n = 16) 的 混 洗 网 。 如 果 4 x 4 开关 的 成 本 是 2 x 2 成 本 的 四 倍 ， 请 比较 用 4 x 4 开 
关 与 用 2 x 2 开关 构成 的 混 洗 网 的 成 本 ，n 值 为 数列 4, 42, 8, …, 依次 类 推 。 定性 比较 用 两 种 
不 同 的 方式 构成 的 混 洗 网 的 阻塞 可 能 性 。 

12.6 假定 PAR 段 (参见 图 12-14) 中 每 个 程序 的 执行 需要 1 个 时 间 单 位 。 程 序 由 三 个 连续 段 构成 。 
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每 个 段 需要 /个 时 间 单 位 并 且 必 须 在 单 处 理 器 上 执行 。 用 两 个 PAR 段 将 三 个 连续 段 分 开 ， 每 

个 段 由 上 个 可 以 在 独立 的 处 理 器 上 执行 的 程序 构成 。 当 它 在 "个 处 理 器 的 多 处 理 器 系统 上 运 

行 时 ， 给 出 该 程序 的 加 速 表达 式 ， 假 定 x<k。 当 x 增 大 且 n = 时， 加 速 的 极限 值 是 多 少 ? 从 

这 个 结果 中 ， 你 知道 实际 上 带 有 并 行 能 力 的 程序 中 连续 段 的 作用 是 什么 吗 ? 

在 一 个 n 维 超 立 方 体 中 消息 传输 的 最 短 距离 是 1 步 跳跃 ,最 长 距离 是 n 步 跳跃 。 假 定 所 有 的 

源 /目的 对 是 相等 的 ， 消 息 传输 的 距离 是 大 于 (lrn) /2 还 是 小 于 (1+n) /2? 证 明 你 的 结论 。 

在 一 个 双 指 令 循环 (如 图 12-15 所 示 ) 中 ， 利 用 测试 - 置 位 指令 对 一 个 锁 变量 进行 “ 忙 等 待 ” 

操作 时 浪费 了 本 可 以 用 于 计算 的 总 线 周 期 。 针 对 该 问题 ， 请 给 出 一 种 由 操作 系统 维护 的 

“集中 式 等 待 任务 队列 ”的 解决 方案 。 假 定 操作 系统 可 以 由 用 户 任务 调用 ， 并 且 操作 系统 

可 以 从 等 待 执行 的 任务 中 进行 选择 并 分 配给 一 个 处 理 器 执行 。 

在 高 速 缓存 一 致 性 中 支持 和 反对 无 效 化 策略 与 修改 策略 的 观点 分 别 是 什么 ? 

12.6.3 节 中 讨论 的 高 速 缓存 一 致 性 控制 并 不 能 代 趟 锁 变 量 。 那 么 ， 利 用 锁 变 量 能 够 代替 高 

速 缓存 一 致 性 控制 吗 ? 

如 果 不 采 用 图 12-18 中 的 程序 而 是 采用 图 12-19 中 的 程序 ， 估 算 一 下 性 能 的 改善 情况 。 假 定 

执行 程序 的 每 一 步 所 需 的 时 间 一 定 。 

修改 图 12-19 中 的 程序 ， 使 之 适合 于 在 4 处 理 器 机 器 上 执行 。 

修改 图 12-20 中 的 程序 ， 使 之 适合 于 在 4 处 理 器 机 器 上 执行 。 

对 于 小 型 向 量 ， 用 图 12-19 中 的 方法 计算 点 积 不 如 使 用 单一 处 理 器 。 佑 算 一 下 该 方法 具有 

更 高 性 能 时 向 量 的 最 小 规模 。 假 定 执行 程序 的 每 一 步 所 需 的 时 间 一 定 。 

用 图 12-20 中 的 方法 重复 12.14 中 的 问题 。 

共享 存储 器 多 处 理 器 和 消息 传递 多 计算 机 都 是 支持 同时 执行 交互 任务 的 体系 结构 。 这 两 

种 体系 结构 中 哪 种 更 容易 模拟 另 一 种 的 动作 ? 简要 说 明 你 的 理由 。 

以 太 网 总 线 局 域 网 协议 在 消息 传送 时 间 远 远大 于 2r (其 中 z 是 数据 从 总 线 的 一 端 到 另 一 端 

的 传输 延迟 ) 时 是 最 适合 的 。 可 能 存在 这 种 情况 吗 ? 即使 源 节 点 在 2z 的 冲突 窗口 内 检测 到 

冲突 时 ， 目 的 节点 仍 能 正确 接收 到 一 个 非 失真 的 消息 吗 ? 如 果 不 能 ， 说 明 你 的 理由 。 如 

果 你 认为 可 能 ， 请 给 出 总 线 上 源 节 点 、 目 的 节点 和 干扰 节点 之 间 的 相对 位 置 ， 并 描述 相 

关 事 件 的 时 间 。 

邮箱 式 看 储 器 是 一 个 具备 如 下 特征 的 RAM: 满 /空位 (FJ/E) 与 每 个 内 存 字 位 置 相关 。 指 令 
PUT R0, BOXLOC, WAITSEND 


按照 如 下 方式 执行 。 与 邮箱 式 存储 器 位 置 BOXLOC 相 关 的 FJE 位 用 来 测试 。 如 果 FJE 为 0 表 
示 空 ， 那 么 寄存 器 RO 中 的 内 容 将 被 写 到 BOXLOC 中 ; 如 果 F/E 为 1 表示 满 ， 就 执行 下 面 的 


串 行 指令 。 否 则 (也 就 是 PE=1) 不 执行 任何 操作 ， 并 且 将 执行 控制 传递 给 在 程序 内 存 中 
且 位 置 为 WAITSEND 的 指令 。 


(a) 请 给 指令 
GET R0, BOXLOC, WAITREC 
下 一 个 适当 的 定义 ， 作 为 对 PUT 指令 的 补充 。 
(b) 假定 在 一 个 多 处 理 器 系统 中 不 同 处 理 器 上 运行 的 两 个 任务 Ti 和 Tz， 利 用 PUT 和 GET 指 
令 在 共享 的 邮箱 式 存储 器 上 由 Ti 向 T: 传 送 一 个 单字 消息 的 流 。 用 汇编 语言 为 Ti 和 T., 编 写 
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程序 段 ， 在 没有 邮箱 式 存储 器 但 是 具有 TAS 指 令 的 共享 存储 器 处 理 器 系统 中 实现 相同 的 


功能 。 
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附录 人 
逻辑 电路 


数字 计算 机 中 的 信息 是 由 被 称 为 未 加 电路 的 电子 网 络 表示 和 处 理 的 。 这 些 电路 对 二 进 制 变 
重 进行 操作 ， 我 们 可 以 为 二 进 制 变量 赋 以 两 个 不 同 的 值 ， 通 常 是 0 和 1。 本 附录 将 对 逻辑 函数 和 
实现 电路 做 简要 描述 ， 并 对 集成 电路 技术 做 简单 介绍 。 


A.1 基本 逻辑 函数 


下 面 用 一 个 所 有 家 庭 都 会 发 生 的 实际 问题 来 介绍 二 进 制 丈 辑 。 来 看 一 个 由 两 个 开关 zx t 
制 开 / 关 状态 的 灯泡 。 每 个 开关 都 可 以 处 于 两 个 可 能 的 位 置 : 0 或 1 中 的 任意 一 个 ， 如 图 A-1a 所 示 。 
这 样 它 就 可 以 用 一 个 二 进 制 变量 表示 。 我 们 将 开关 的 名 称 作为 其 对 应 二 进 制 变量 名 称 。 图 中 还 有 zT 
一 个 电源 和 一 个 灯泡 。 开 关 端 口 的 连接 方式 决定 了 开关 控制 灯 的 方式 。 只 有 存在 一 个 从 电源 经 开 |i 
关 网 络 到 灯泡 的 闭合 回路 时 ， 灯 才 会 亮 。 我 们 用 二 进 制 变量 /表示 灯 的 状态 。 如 果 灯 亮 , f= 1; 如 果 
灯 不 亮 , f= 0。 这 样 ，f= 1 说 明 电 路 中 至 少 有 一 个 闭合 回路 ;而 f= 0 说 明 没有 闭合 回路 。 显 然 , f 
是 变量 x. 和 x 的 函数 。 

下 面 看 一 些 控制 灯 状 态 的 可 能 情况 . 首先， 假设 任 一 开关 在 1 的 位 置 时 灯 都 会 亮 ， 即 当 


xi=1 H. x; =0 
或 

xi=0 BR.xx;=1 
或 

x=1 ER. x =1 
时 , f=1。 


实现 这 种 控制 的 电路 连接 方式 如 图 A-1b 所 示 。 电 路 图 旁 的 迎 辑 真 值 表 表 示 了 这 一 情况 。 表 
中 列 出 了 所 有 可 能 的 开关 状态 及 在 每 个 状态 下 的 值 。 在 逻辑 术语 中 ， 这 个 表格 表示 了 两 个 变量 
nfin “R” (OR) 国 数 。 这 个 操作 在 代数 中 用 符号 “+” 或 符号 “V ”表示 ， 即 

f=x +x=x V x 

我 们 称 x!/、% 为 输入 变量 ,f 为 输出 函数 。 

下 面 是 OR 操作 的 一 些 基本 特性 。 它 是 可 交换 的 ， 即 

XI + X; = X2 + XI 

这 一 性 质 可 扩展 到 “变量 中 ， 即 


f=xitx teet Xa 
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地 线  - = 
a) 由 两 个 开关 控制 的 灯泡 















0 0 f(xpx;) = xr: Xo 
7 -3 i r i 0 0 0 
1 0 1 0 
1 0 0 
1 1 1 


— x f(x x,) = x, @ x, 
°. x, a x, j| 9 0 Ó 
< k 1 O 1 
: 1 1 0 


d) 异 或 联接 (“ 异 或 ”控制 ) 
图 A-1 电灯 开关 示例 


如 果 任意 一 个 % 的 值 为 1，j 的 值 就 为 1。 这 反映 了 在 图 A-lb 中 的 两 个 开关 上 并 联 更 多 开关 时 的 效 
果 。 而且， 通过 观察 真 值 表 可 以 看 出 


l+x=1 
H 
O+x=x 
现在 ， 假 设 只 有 当 两 个 开关 都 在 1 的 位 置 时 灯 才 会 亮 。 这 个 状态 的 电路 连接 和 相应 的 真 值 表 
表示 如 图 A-lc。 这 种 情况 为 “与 ”(AND) 操作 ， 使 用 符号 “ . ”或 “和 ”表示 。 即 
Jf=x x= xi À x; 
与 操作 的 一 些 基 本 性 质 有 
Xi ` X2= X2 ` Xi 


1: x=x 





ZEB A 


及 
0.x=0 
与 冰 数 也 可 扩展 到 n 个 变量 
= :Xo 
上 式 只 有 当 所 有 的 x; 都 取 1 时 才 得 1。 这 反映 了 在 图 A-lc 中 两 个 开关 上 串联 更 多 的 开关 而 产生 的 效 
果 。 

要 讨论 的 最 后 一 种 控制 灯 状 态 的 开关 方式 是 另 一 种 常见 的 情况 。 假 设 走廊 的 两 端 都 有 开关 ， 
每 个 开关 都 应 该 能 控制 灯 的 开 或 关 。 即 : 如 果 灯 是 亮 的 ， 改 变 任 一 个 开关 的 位 置 都 应 将 其 关 
BJ; 而 如 果 灯 是 灭 的 ， 改 变 任 一 个 开关 的 位 置 都 应 将 其 打开 。 假 设 两 个 开关 都 在 0 位 置 时 ， 灯 是 
灭 的。 那么 将 任 一 个 开关 置 为 1 都 能 将 灯 打 开 。 现 在 假定 灯 是 亮 的 ， 且 x = 1, x, = 0。 显 然 将 开 
关 xti 变 为 0 可 以 把 灯 关 闭 。 而 且 ， 将 x 置 为 1 也 能 将 灯 关 闭 ， 即 当 x = x = 1 时 ，F = 0。 实 现 这 种 控 
制 的 电路 如 图 A-1d 所 示 。 相 应 的 逻辑 操作 称 为 “ 异 或 ”(EXCLUSIVE-OR，XOR) 操作 ,使 用 
符号 “@” 表 示 。 它 的 性 质 有 

Xxi@x; = x;@ xi 
l@x= x 
K 
0@x=x 


其 中 x 代表 x 的 “ 非 ”操作 (NOT)。 单 变量 的 函数 f=x， 当 x = 0 时 取 1， 当 x = 1 时 取 0。 我 们 称 
输入 x 取 反 或 求 补 了 。 


电子 逻辑 门 


因为 具有 相似 性 和 简单 性 ， 使 用 开关 、 闲 合 或 断 开 电路 、 以 及 用 灯泡 来 说 明 逻 辑 变量 和 函 
数 的 思想 是 非常 方便 的 。 前 面 介 绍 的 逻辑 概念 同样 适用 于 数 
字 计算 机 中 处 理 信息 的 电子 电路 。 但 物理 变量 是 电路 的 电 平 O r-t 
和 电流 ， 而 不 是 开关 的 位 置 以 及 闭合 或 断 开 的 电路 。 例 如 ， 
考虑 一 个 电路 ， 其 输入 电 平 为 +5 伏 或 0 伏 。 电 路 输出 电 平 同样 A 
是 +5 伏 或 0 伏 。 现在， 如果 用 +5 伏 代表 逻辑 1，0 伏 代表 你 辑 0， “| 人 一 
那么 就 可 以 指定 该 电路 逻辑 操作 的 真 值 表 ， 从 而 描述 电路 的 “总 
作用 。 与 门 
借助 于 晶体 管 ， 我 们 可 以 设计 出 简单 的 电路 完成 与 、 或 、 | 
SALUER. SI ERZEKE MERKAN. 图 A-2 * 一 人 >o =i 
给 出 了 这 些 门 的 标准 符号 。 在 逻辑 门 的 输入 或 输出 反 相 时 ， mS 
我 们 使 用 一 种 更 为 紧凑 的 图 形 记号 来 表示 非 操作 。 在 这 种 情 — 
况 下 ， 反 相 用 一 个 小 网 图 表示 。 O /es 
逻辑 门 的 电路 实现 将 在 A.5 节 中 进行 讨论 。 接 下 来 继续 
讨论 怎样 使 用 逻辑 门 构造 一 些 具 有 更 复杂 逻辑 功能 的 逻辑 PRI 
网 络 。 图 A-2 标准 逻辑 门 符号 
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A.2 逻辑 函数 的 组 合 
考虑 图 A-3a 中 由 两 个 与 门 和 一 个 或 门 组 成 的 网 络 。 它 可 以 用 下 面 的 式 子 表示 


f= xit Xx +X X2 
图 A-3b 是 这 个 表达 式 的 真 值 表 。 首 先 ， 与 门 的 值 由 每 个 输入 值 决定 。 而 函数 的 值 由 或 操作 
决定 。f 的 真 值 表 与 异 织 函数 的 真 值 表 一 样 ， 所 以 图 A-3a 使 用 与 门 、 或 门 、 非 门 实现 了 异 或 函数 。 
逻辑 表示 式 x1: xz + xi Xz 称 为 积 之 和 的 形式 ， 因 为 OR 操作 有 时 被 称 作 “ 和 ”函数 ， 而 AND 操 
作 被 称 作 “ 积 ”函数 。 





f= Xl X, + XI X, 


a) 异 或 函数 网 络 





b) X. +m ORREK 


图 A-3 使 用 与 门 、 或 门 、 非 门 实现 异 或 函数 


需要 注意 的 是 ， 为 了 说 明 执行 操作 的 顺序 ， 将 表达 式 写 为 = (x) ` za) + @ (Za) 更 为 合 
适 。 为 了 简化 表达 式 ， 我 们 需要 对 与 、 或 、 非 三 种 操作 的 优先 级 进行 定义 。 在 没有 图 括号 时 ， 
逻辑 表达 式 的 操作 应 当 按 照 以 下 顺序 执行 ， 非 、 与 ， 然 后 是 或 。 此 外 ， 在 不 产生 歧义 的 情况 下 
习惯 上 省 略 “' ”运算 符 。 

回 到 积 之 和 的 形式 ,我 们 现在 解释 如 何 直 接 从 真 值 表 推导 出 任意 逻辑 函数 的 积 之 和 形式 。 
考虑 表 A-1 中 的 真 值 表 ， 并 假设 用 与 门 、 或 门 、 非 门 组 成 函数 及 。 对 于 表 中 = 1 的 每 一 行 ， 都 引 
入 积 之 和 形式 中 的 一 个 乘积 (与) 项。 这 个 乘积 项 包括 所 有 三 个 输入 变量 。 非 操作 作用 在 单个 
变量 上 ， 使 得 只 有 当 这 些 变量 取 与 真 值 表 的 那 一 行 对 应 的 某 个 确定 值 时 ， 乘 积 项 才 为 1。 这 表明 
如 果 = 0， 则 ;就 在 乘积 项 中 ; 如 果 = 1， 则 zx 在 乘积 项 中 。 例 如 ， 表 中 第 4 行 的 函数 值 为 1， 
而 输入 变量 为 





交友 4 


(xı, X2, xs) = (0, 1, 1) 
则 相应 的 乘积 项 是 x xo. HRA fi ATENE, B 


f = XxXxX + Xi X2X3 + X1X2X3 + XiX2X5 


表 A-1 两 个 3 变量 函数 


xi x2 x f f: 
0 0 0 1 1 
0 0 1 I 1 
0 1 0 0 1 
0 1 1 1 0 
1 0 0 0 1 
1 0 1 0 1 
1 1 0 0 0 
1 1 1 1 0 





与 这 一 表达 式 相对 应 的 逻辑 网 络 在 图 A-4 的 左 方 。 另 外 一 个 例子 ， 异 或 函数 的 积 之 和 表达 式 
可 以 使 用 这 个 方法 由 其 真 值 表 导 出 。 这 个 方法 可 以 从 任意 大 小 的 真 值 表 导 出 积 之 和 表达 式 以 及 
相应 的 逻辑 网 络 。 


x 
X 
r => fi 


Xo 


X3 


fi = XIxX,X; + 1X2X3 + X| XX3 + X| XX f, = XX; + XX 


图 A-4 表 A-1 中 万 的 逻辑 网 络 及 与 其 等 价 的 最 小 网 络 


A.3 逻辑 表达 式 的 化 简 


前 面 介 绍 了 如 何 从 真 值 表 导出 一 个 积 之 和 表达 式 。 实 际 上 ， 对 于 任意 一 个 特定 的 真 值 表 都 
有 许多 等 价 的 表达 式 和 逻辑 网 络 。 两 个 逻辑 表达 式 或 逻辑 门 电路 如 果 具 有 相同 的 真 值 表 ， 那 么 
它们 就 是 等 价 的 。 与 上 一 节 导 出 的 的 积 之 和 表达 式 等 价 的 一 个 表达 式 是 
x l X2 十 总 区 
要 证 明 这 一 点 ， 我 们 在 表 A-2 中 列 出 这 个 简单 表达 式 的 真 值 表 ， 并 表明 它 与 表 A-1 中 f 函数 的 真 
值 表 是 相同 的 。 创 建 ,xz + x 真 值 表 的 过 程 分 为 三 步 。 首 先 ， 计 算 每 种 输入 值 下 乘积 项 


的 值 ， 然 后 是 乘积 项 xs。 最 后 ， 将 这 两 列 相 “ 或 ”得 到 表达 式 的 真 值 表 。 这 个 真 值 表 与 表 A-1 
的 上 函数 真 值 表 完全 一 致 . 
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为 了 简化 逻辑 表达 式 ， 我 们 需要 进行 一 系列 的 代数 操作 。 这 些 操作 所 使 用 的 新 的 逻辑 规则 
是 分 配 律 
w (y + z) = wy + wz 
和 恒等式 


w+ w=1 


表 A-2 表达 式 X 1X2 + X2 Xs 的 计算 


x x. x Xix Xy X i X> +X = f, 
0 0 0 1 0 1 
0 0 1 1 0 1 
0 1 0 0 0 0 
0 1 1 0 1 1 
1 0 0 0 0 0 
1 0 1 0 0 0 
1 1 0 0 0 0 
1 1 1 0 1 1 





表 A-3 给 出 了 分 配 律 的 真 值 表 证 明 。 现 在 应 该 清楚 ， 像 这 样 的 规则 总 是 可 以 通过 列 出 其 左边 和 右 
边 的 真 值 表 ， 然 后 显示 它们 相同 的 方式 来 证 明 。 逻 辑 规则 如 分 配 律 ， 有 时 被 称 为 恒等式 。 尽 管 
在 这 里 用 不 到 ， 但 为 了 完整 性 ， 再 给 出 分 配 律 的 另 一 种 形式 : 


W + yz = (w + y) (w + z) 


表 A-3 真 值 表 方法 证 明 表 达 式 等 价 





w y z y+z 等 号 左边 w (y + z) wy wz 等 号 右边 wy + wz 
0 0 0 0 0 0 0 0 
0 0 1 1 0 0 0 0 
0 1 0 1 0 0 0 0 
0 1 1 1 0 0 0 0 
1 0 0 0 0 0 0 0 
1 0 1 1 1 0 1 1 
1 1 0 1 1 1 0 1 
1 1 1 1 1 1 1 1 


—— 00 L.. _ 
逻辑 化 简 的 上 自 的 是 根据 一 些 标准 减少 实现 特定 逻辑 函数 的 成 本 。 特 别 地 ， 我 们 希望 从 由 真 
值 表 导 出 的 积 之 和 表达 式 开始 ， 将 它 化 简 为 最 小 积 之 和 表达 式 。 为 了 定义 化 简 的 标准 ， 有 必要 
引入 一 个 衡量 积 之 和 表达 式 的 大 小 或 成 本 的 量度 。 通 常 成 本 量度 是 以 图 A-4 的 形式 实现 表达 式 所 
需 的 门 和 门 输入 的 总 数 。 例 如 ， 图 中 较 大 的 表达 式 成 本 为 21， 由 5 个 门 和 16 个 门 输入 组 成 。 在 计 
数 过 程 中 忽略 了 输入 的 反 相 。 较 小 的 表达 式 成 本 为 9， 由 3 个 门 和 6 个 门 输入 组 成 。 现 在 可 以 明确 ， 
如 果 没 有 其 他 等 价 的 积 之 和 表达 式 具 有 更 小 的 成 本 ， 那 么 这 个 积 之 和 表达 式 就 是 最 小 的 。 下 面 
所 举 的 简单 例子 可 以 清楚 地 看 出 我 们 得 到 了 最 小 的 表达 式 。 因 此 不 再 给 出 最 小 化 的 严格 证 明 。 
简化 一 个 给 定 表达 式 的 一 般 算术 操作 如 下 。 首 先 ， 将 只 有 一 些 变量 在 一 个 乘积 项 中 为 反 (X), 
而 在 另 一 个 乘积 项 中 为 真 (*)， 并 且 其 他 变量 相同 的 项 结合 为 一 组 。 根 据 分 配 率 ， 提 出 由 其 他 变量 
组 成 的 公共 乘积 子 项 后 ， 则 剩 下 x+ x 项 ， 其 值 为 1。 对 第 一 个 所 的 表达 式 应 用 这 一 操作 ， 我 们 得 到 : 
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fi= Xi X2X3+ XiX2X + X1X2X3 + X1X2X3 
= X.X2(X3+ xX) + (Xi + XI) X2X5 
= XIX2 1+1. xx 
= X1 Xa + XXX 


这 个 表达 式 是 最 小 的 。 相 应 的 网 络 连接 如 图 A-4 所 示 。 
表 A-4 ”二进制 逻辑 规则 





a R 算术 等 式 

交换 律 w+y=y+w wy = yw 

结合 律 (w +y) + z = w + (y + 2) (wy)z = w(yz) 

分 配 律 w + yz = (w + y)(w + z) w (y + z) = wy + wz 

E W+w=w ww = w 

对 合 律 w=w 

下 锌 律 w+w=1 ww=0 

德 摩根 律 w+y= wy wy" w +y 
l+w=1 0-w=0 
O+tw=w l-w=w 
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很 有 用 的 规则 是 
w+w=w 
这 个 规则 允许 我 们 重复 使 用 乘积 项 ， 从 而 在 提取 公 因 式 的 过 程 中 ， 某 个 乘积 项 可 与 其 他 多 个 项 
组 合 。 举 个 例子 ， 看 一 下 表 A-1 中 的 万 函 数 。 其 积 之 和 表达 式 可 直接 由 真 值 表 导 出 为 
f = X1X2X5 + X iX + X X2X3 +XIX2X3 + XIX2X3 
通过 重 写 第 一 个 乘积 项 Xx;x2x3 并 交换 项 的 位 置 (根据 交换 律 )， 我 们 得 到 
f= XI1X2X3 +X iX2 + Xi XX; XI X2X3 + X IX1X3+ X X2 X3 
将 乘积 项 结对 并 提取 公 因 子 
f, = Xixa (X3 +X) + XiX2 (x3 +x) + x, (X: +X) xs 
= Xx+ 51X24+X1X5 
前 两 项 再 次 通过 因 式 分 解 化 去 ， 然 后 得 到 最 小 表达 式 
f = X2 + x 1 Xs 
这 样 就 完成 了 我 们 对 逻辑 表达 式 的 算术 化 简 的 讨论 。 这 项 数学 练习 有 一 个 明显 的 实际 应 用 ， 
就 是 由 较 少 的 门 和 输入 构成 的 网 络 更 加 廉价 并 且 易 于 实现 。 因 此 ， 确 定 与 所 给 表达 式 等 价 的 最 
简 表达 式 符合 经 济 利 益 的 需要 。 表 A-4 中 总 结 了 操作 逻辑 表达 式 时 应 用 的 规则 。 它 们 成 对 出 现 ， 
显示 出 对 称 性 ， 因 为 它们 对 “与 ”和 “或 ”函数 同样 适用 。 到 上 自前 为 止 ， 我 们 还 没有 机 会 使 用 
对 合 律 或 德 摩根 律 ， 但 是 在 下 一 节 中 会 发 现 它 们 很 有 用 。 


A.3.1 使 用 卡 诺 图 化 简 
在 对 表 A-1 中 的 函数 有 和 巨 进行 代数 化 简 的 过 程 中 ， 在 某 一 时 刻 必须 猜测 最 佳 的 处 理 方法 。 
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例如 ， 在 卢 的 化 简 中 判断 第 一 步 重 写 项 xxzxs 并 不 明显 。 有 一 种 几何 方法 可 以 迅速 地 导出 含有 
几 个 变量 的 逻辑 函数 的 最 小 表达 式 。 这 一 技术 依赖 于 真 值 表 的 另 一 种 表示 形式 ， 称 为 卡 诺 图 。 对 
于 一 个 3 变量 函数 ， 它 是 一 个 由 2 行 4 列 共 8 个 方块 组 成 的 长 方形 ， 如 图 A-5a 所 示 。 每 个 方块 对 应 于 
输入 变量 的 一 组 特定 的 值 。 例 如 ， 第 一 行 的 第 三 个 方块 表示 值 Ga, x, x) = (1 1, 0) 。 因 为 3 变量 真 
值 表 为 8 行 ， 所 以 卡 诺 图 显然 需要 8 个 方块 ， 方 块 中 的 内 容 是 与 输入 变量 值 相 对 应 的 函数 值 。 

构建 卡 诺 图 的 关键 思想 是 水 平和 垂直 相 邻 的 方块 对 应 着 只 有 一 个 变量 不 同 的 输入 变量 值 。 


当 两 个 相 邻 的 方块 值 都 为 1， 表 明 可 以 进行 代数 化 简 。 





f f i y X|X2X4 
83 = Xa t XX3 84 = X1X2Xy + X3 XX4 + oO | 
XIX3X4 Í 


b) 4 变量 图 
图 A-5 使 用 卡 诺 图 进行 化 简 
在 图 A-5a 函 数 户 的 卡 诺 图 中 ， 第 一 行 最 左边 的 两 个 值 为 1 的 方块 与 乘积 项 zzzs、xXuoz3 对 应 。 
在 最 小 化 户 代数 表达 式 过 程 中 先 执行 化 简 


XI1X2X3+ X IX2X3= X X5 
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将 图 中 的 两 个 1 格 圈 为 一 组 就 可 以 直接 得 到 化 简 结果 。 与 一 组 方块 相对 应 的 乘积 项 是 在 这 些 方 块 
中 值 不 变 的 那些 输入 变量 的 乘积 。 如 果 x 在 一 组 1 格 中 的 值 为 0， 则 将 x; 加 入 乘积 项 ， 但 如 果 x 的 
值 是 1， 则 将 x 加 入 乘积 项 。 两 方块 相 邻 的 情况 包括 最 左 端的 方块 与 最 右 端 的 方块 相 邻 。 继 续 我 
们 对 万 的 讨论 ， 由 最 左 列 和 最 右 列 组 成 的 4 个 1 格 的 组 化 简 得 到 单一 变量 项 x*,， 因 为 x 是 该 组 中 惟 
一 一 个 值 不 变 的 变量 。 其 他 两 个 变量 的 所 有 4 种 可 能 的 组 合 都 在 该 组 中 出 现 过 了 。 

卡 诺 图 可 以 用 于 多 于 3 个 变量 的 情况 。4 变 量 的 卡 诺 图 可 以 由 两 个 3 变量 的 卡 诺 图 得 到 。 图 A- 
5$b 是 4 变量 卡 诺 图 的 例子 ， 同 时 还 给 出 了 图 中 表示 的 函数 的 最 小 表达 式 。 除 了 2 个 方块 和 4 个 方块 
的 组 外 ， 现 在 还 可 以 组 建 8 个 方块 的 组 。 这 样 的 分 组 在 gs 的 图 中 有 所 显示 。 注 意 8 中 角 上 的 4 个 
方块 也 构成 了 一 个 合法 的 4 格 组 ， 代 表 乘 积 项 xx4。 与 3 变量 的 图 一 样 ， 与 一 组 方块 所 对 应 项 是 
组 中 没有 改变 值 的 变量 乘积 。 例 如 8z 图 中 右上 和 角 4 个 1 格 的 组 表示 为 乘积 项 zx3， 因 为 组 中 xz = 1， 
x= 0。 该 组 中 包含 了 变量 z2 与 习 所 有 可 能 的 取 值 组 合 。 对 于 5 变量 函数 也 可 以 使 用 卡 诺 图 。 在 这 
种 情况 下 ， 将 使 用 两 个 4 变量 卡 诺 图 ， 其 中 一 个 对 应 于 第 5 个 变量 取 0 的 情况 ， 另 一 个 对 应 取 1 的 
情况 。 

可 以 很 容易 地 得 出 在 卡 诺 图 中 划分 2 格 组 、4 格 组 、8 格 组 等 的 一 般 方法 。 两 个 相 邻 的 值 为 1 
的 对 可 以 组 合 为 一 个 4 格 组 。 类 似 地 ， 两 个 相 邻 的 4 格 组 可 以 组 成 一 个 8 格 组 。 通 常 ， 任 意 有 效 组 
中 方 格 的 个 数 一 定 为 2， 其 中 为 整数 。 

我 们 现在 考虑 使 用 卡 诺 图 得 到 最 小 积 之 和 表达 式 的 过 程 。 从 图 A-5 中 可 以 看 出 ， 大 的 值 为 1 
的 组 对 应 于 小 的 乘积 项 。 这 样 ， 要 得 到 简单 门 电路 ， 图 中 所 有 1 的 方块 分 组 越 少 越 好 。 一 - 般 说 来 ， 
我 们 应 当选 择 组 最 少 的 分 法 ， 选 择 那 些 尽 可 能 大 的 包含 图 中 所 有 1 的 组 。 例如， 考虑 图 A-5b 中 的 
及 数 8:。 如 图 所 示 ， 四 个 角 上 值 为 1 的 方块 组 成 了 表示 乘积 项 xzx4 的 组 。 另 一 个 4 格 组 在 右上 角 ， 
表示 乘积 项 s x3。 这 两 个 组 包括 了 除 位 置 为 Ga, x>, x, x4) = (0, 1, 0, D 外 所 有 值 为 1 的 方块 。 包 含 
这 个 方块 的 最 大 的 组 是 一 个 2 格 组 ， 表 示 乘 积 项 zxaxe。 因 此 ，8: 的 最 小 表达 式 是 

&2= X2X4 XI X3 + X2X3X4 
图 中 其 他 函数 的 最 小 表达 式 可 使 用 类 似 方法 得 到 。 注 意 g84 有 两 种 可 能 的 最 小 表达 式 ， 一 个 包 
括 x veox 项 ， 另 一 个 包括 xxzx 项 。 经 常会 出 现 一 个 给 定 的 函数 有 不 止 一 个 最 小 表达 式 的 情况 。 

在 我 们 举 的 所 有 例子 中 ， 得 到 最 小 表达 式 都 比较 容易 。 通 常 这 一 过 程 有 正式 的 算法 ， 但 这 

里 不 再 讨论 。 


A.3.2 无 关 项 条 件 


在 许多 情况 下 ， 数 字 电 路 的 一 些 输入 值 永远 都 不 会 发 生 。 例如， 考虑 二 进 制 编码 的 十 进 制 
数 (BCD) 表示 法 。 四 个 二 进 制 变量 b;、b,、b, 和 bo 表示 十 进 制 数 0 到 9，、 如 图 A-6 所 示 。 这 4 个 变 
量 总 共有 16 个 不 同 的 值 ， 其 中 只 有 10 个 用 于 表示 十 进 制 数 。 剩 下 的 值 没 有 用 到 。 因 此 ， 任 何 处 
理 BCD 码 的 逻辑 电路 都 永远 不 会 在 其 输入 中 磁 到 这 6 个 值 中 的 任何 一 个 。 

图 A-6 给 出 了 一 个 操作 BCD 数 的 特定 函数 的 真 值 表 。 我 们 并 不 关心 那些 从 不 使 用 的 输入 值 的 
函数 值 是 多 少 ; 因此 ， 它 们 被 称 为 无 关 项 ， 在 真 值 表 中 用 字母 “d” 表 示 。 为 了 实现 一 个 电路 ， 
对 应 于 约束 项 的 函数 值 可 被 任意 赋值 为 0 或 1。 最 佳 的 赋值 方法 将 得 到 最 小 的 逻辑 门 实现 。 当 无 
关 项 能 够 扩大 一 个 1 值 的 组 时 ， 我 们 就 把 它 赋 值 为 1。 因 为 较 大 的 组 对 应 着 较 小 的 乘积 项 ， 适 当 
地 使 用 无 关 项 能 够 加 强 最 小 化 的 程度 。 


KA] 
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图 A-6 中 的 函数 表示 了 如 下 对 输入 十 进 制 数 的 处 理 过 程 : 当 输入 是 一 个 可 被 3 整除 的 非 零 数 时 ， 
输出 为 1。 我 们 需要 3 个 组 来 包含 图 中 的 3 个 值 为 1 的 方块 ， 并 。 Tam 





且 尽 可 能 使 用 无 关 项 来 扩大 组 。 表示 f 
0 0 

A.4 与 非 门 、 或 非 门 的 组 合 1 ° 
3 1 

现在 来 看 另外 两 个 被 称 为 与 非 门 (NAND) 和 或 非 门 4 0 
(NOR) 的 基本 逻辑 门 ， 由 于 它们 的 电路 实现 很 简单 ， 因 此 在 6 I 
实践 中 被 广泛 使 用 。 这 些 门 的 真 值 表 如 图 A-7 所 示 。 它 们 等 价 š 0 
地 实现 了 “ 非 ”函数 下 的 “与 ”和 “或 ”函数 ， 这 便 是 它们 9 1 
的 名 称 以 及 标准 逻辑 符号 的 由 来 。 我 们 用 键 头 “1 ”和 “1 d 
代表 与 非 及 或 非 运算 符 ， 并 使 用 表 A-4 中 的 德 摩根 律 ， 可 以 ”未 使 用 4 
得 到 d 


x, Í, x, = XX, = Xi + X> 
和 
x, L x, = X, + x, = XX; 
存在 多 于 两 个 输入 的 与 非 门 和 或 非 门 ， 根 据 德 摩根 律 的 简单 
扩展 可 以 得 到 
x, tx, tee t X = XX, X. = X. + Xz 十 十 大 


和 





xr |x, peha = X +X, t + X, = X1X1 An 


使 用 与 非 门 和 或 非 门 进行 逻辑 设计 不 像 使 用 与 、 或 、 非 7 
门 那样 直截了当 。 设 计 过 程 的 主要 难点 之 一 是 结合 律 对 与 非 | 
和 或 非 操作 是 无 效 的 。 我 们 稍 后 再 对 这 一 问题 展开 讨论 。 先 EAS ARANE Riña 
来 讨论 只 使 用 与 非 门 实现 任意 逻辑 函数 的 简单 过 程 。 将 一 个 积 之 和 形式 的 逻辑 网 络 变换 成 相应 





f = xl x, = XIX) = XI +X, f = x, x; = N+ = XX 
x Xl 
x” {>~ x J> 
引 与 非 门 b) 或 非 门 


图 A-7 与 非 门 和 或 非 门 
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只 由 与 非 门 组 成 的 网 络 有 一 个 直接 的 方法 。 借 助 一 个 例子 可 以 很 容易 地 了 解 这 个 过 程 。 考 虑 下 
面 对 应 着 由 三 个 2 输入 与 非 门 组 成 的 4 输入 网 络 的 逻辑 表达 式 的 代数 运算 过 程 。 
(x, Í! x,) ! G, ! x.) = Gux,)(x;x,) 

= XX, +AA, 

= XX, + XX 
在 推导 过 程 中 我 们 已 经 使 用 了 德 摩根 律 和 对 合 律 。 图 A-8 给 出 了 与 这 个 推导 对 应 的 逻辑 网 络 。 因 
为 任何 逻辑 函数 都 可 以 天 示 为 “ 积 之 和 ”( 与 -或 ) 形式 ， 而 且 前 述 的 导出 过 程 完全 可 逆 。 我 们 
得 出 结论 ， 任 何 逻 辑 函 数 都 可 以 表示 为 “与 非 -与 非 ” (NAND-NAND) 形式 。 可 以 看 到 这 一 结 
论 对 含有 任意 数量 变量 的 函数 都 是 正确 的 。 与 非 门 的 输入 数 显然 与 相应 的 与 门 和 或 门 的 输入 数 
相同 。 


图 A-8 等 价 的 与 非 -与 非 和 与 -或 网 络 


让 我 们 回 到 关于 结合 律 对 与 非 操 作 符 不 适用 这 一 话题 上 来 。 在 图 A-8 的 步 台 中 使 用 与 非 门 对 
逻辑 网 络 进行 设计 上 时， 与 非 门 所 需 的 输入 数目 可 能 会 比 标准 商用 与 非 门 输入 数 多 。 如 果 使 用 与 
门 和 或 门 实现 ， 这 就 不 成 问题 ， 因 为 与 和 或 操作 符 是 可 结合 的 ， 可 以 将 有 限 遍 入 的 门 直 接 级 联 
起 来 。 使 用 2 输入 门 实现 3 输入 与 函数 和 或 函数 的 情况 如 图 A-9a 所 示 。 使 用 与 非 门 的 解决 方案 就 
不 这 么 简单 了 。 例 如 ， 一 个 3 输入 与 非 函 数 不 能 用 两 个 2 输入 与 非 门 级 联 实现 。 而 需要 三 个 门 ， 
如 图 A-9b 所 示 。 

对 只 使 用 或 非 门 实现 逻辑 函数 的 讨论 与 前 面 类 似 。 任 意 逻 辑 函 数 都 可 以 表示 为 “和 之 积 ” 
(或 -与 ) 的 形式 。 这 样 的 网 络 可 以 由 等 价 的 或 非 - 或 非 网 络 实现 。 

前 面 的 讨论 介绍 了 一 些 逻辑 设计 的 基本 概念 。 这 一 主题 的 详细 讨论 可 在 许多 教科 书 中 技 到 
(参见 参考 文献 [1、3、7~11])。 

需要 明确 的 是 ， 一 个 给 定 的 膛 辑 函数 可 能 有 许多 不 同 的 实现 。 由 于 实际 应 用 的 需要 ， 我 们 
要 找到 成 本 最 小 的 实现 方法 ， 也 经 常 需 要 在 逻辑 网 络 中 减 小 传输 延迟 。 为 了 描述 逻辑 组 合 的 性 
质 和 尽 可 能 地 降低 成 本 ， 前 几 节 中 介绍 了 最 小 化 的 概念 。 例 如 ， 卡 诺 图 图 形 化 地 表明 了 得 到 最 
佳 结 果 的 操作 可 能 性 。 尽 管理 解 远 辑 网 络 的 最 优化 法 则 很 重要 ， 但 并 不 需要 人 工 实现 最 优化 。 
复杂 的 计算 机 辅助 设计 (CAD) 程序 可 以 完成 这 些 集成 。 设 计 者 只 需要 指定 所 需 的 功能 行为 ， 
CAD 软 件 就 会 给 出 一 个 实现 这 一 功能 的 经 济 且 高 效 的 网 络 。 


a 
~ 





b) 用 2 输入 门 实现 3 输入 与 非 国 数 
图 A-9 门 的 级 联 


A.5 逻辑 门 的 实现 


B A 





现在 让 我 们 关注 在 实践 中 表示 逻辑 变量 和 实现 逻辑 函数 的 方法 。 表 示 有 逻辑 变量 的 物理 参数 
的 选择 明显 依赖 于 具体 的 技术 。 在 电路 里 ， 电 平 或 电流 值 都 可 以 用 于 此 目的 。 

为 了 建立 电 平 和 逻辑 值 或 状态 的 对 应 关系 ， 我 们 引入 了 阅 值 这 一 概念 。 高 于 给 定 阀 值 的 电 
平 表示 一 个 逻辑 值 ， 而 低 于 六 值 的 电 平 表示 另 一 个 。 在 实际 情况 下 ， 由 于 各 种 各 样 的 原因 ，、 电 
路 中 任何 一 点 的 电 平 都 有 小 的 随机 变化 。 因 为 存在 “噪声 " ， 我 们 不 能 确定 益 值 附近 电 平 的 逻辑 
状态 。 如 图 A-10 所 示 ， 为 了 避免 出 现 这 样 的 不 确定 性 ， 应 该 确定 一 个 “禁止 范围 。 这 样 ， 低 于 
Vo, max 的 电 平 表 示 0 值 ， 高 于 Vi, mn 的 电 平 表示 1 值 。 在 下 面 的 讨论 中 ， 将 经 常用 到 “ 低 ” 和 “高 ” 


这 两 个 术语 来 分 别 表示 与 逻辑 值 0 和 和 1 对 应 的 电 平 。 


我 们 对 实现 基本 逻辑 函数 的 电子 线路 的 讨论 将 从 简单 的 由 电阻 和 作为 开关 使 用 的 晶体 管 组 


成 的 电路 开始 。 考 虑 图 A-11 中 的 电路 。 当 图 A-11a 中 的 开关 5 关 
闭 时 ， 输 出 电 平 Vow 等 于 0 《接地 )。 当 5 打开 时 ， 输 出 电 平 Vow 
等 于 提供 的 电 平 Vpy。 图 A-11b 用 晶体 管 T 代 圭 了 开关 $$， 也 可 
以 得 到 同样 的 效果 。 当 提供 给 最 体 管 的 门 输入 电 平 为 0 时 【《 即 
Vin = 0), 晶体 管 相当 于 一 个 打开 的 开关 ， 且 Vow = Vsupply o MV; 
变化 为 Vswpy A, EATARRA, a BB E Von 
非常 接近 0。 因 此 ， 电 路 实现 了 一 个 逻辑 非 门 的 功能 。 

现在 可 以 讨论 更 为 复杂 的 逻辑 函数 的 实现 。 图 A-12 显示 
了 或 非 门 的 实现 电路 。 在 这 种 情况 下 ， 只 有 当 开 关 5。 FS 都 打 
开 时 ， 图 A-12 中 的 Vow 才 是 高 电 平 。 与 之 类 似 ， 图 A-12b 中 只 有 
HA BEV, 和 Vi 都 是 低 电 平时 ，Vow 才 为 高 电 平 。 因 此 ， 该 电 
路 对 应 一 个 或 非 门 ， 其 中 Vs 和 Vs 对 应 于 两 个 输入 变量 Xx!、x2。 


Vmax ~ 


Vimi "T 


| 电压 


逻辑 值 1 


ZHAO 





图 A-10 用 电 平 表示 逻辑 值 
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容易 验证 ， 将 晶体 管 如 图 A-13 那 样 串联 ， 就 可 以 得 到 一 个 与 非 门 电 路 。 逻 辑 函 数 “与 ”和 “或 ” 
可 以 分 别 使 用 与 非 门 和 或 非 门 ， 后 接 图 A-1i 中 的 反 相 器 实现 。 


Vsupply Vsupply 


Vout 


Vin — 





a) 
图 A-11 一 个 反 相 器 电路 
V 


supply V 


supply 
R 
Vout 
Sa N Sp 
a) 


V supply V supply 


V, 


a 





b) 


图 A-12 或 非 门 的 晶体 管 电路 实现 


Vout v. 


£ I| 
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图 A-13 与 非 门 的 晶体 管 电路 实现 


CN 
O 
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注意 ， 与 非 门 和 或 非 门 的 电路 实现 比 与 门 和 或 门 要 简单 。 因 此 ， 在 实践 中 经 常会 使 用 大 量 
与 非 门 和 或 非 门 实现 的 逻辑 函数 。 本 书 中 所 举 的 许多 由 与 、 或 、 非 门 组 成 电路 的 例子 是 为 了 便 
于 理解 。 在 实际 应 用 中 ， 逻 辑 电路 包含 所 有 这 5 种 门 电路 。 


A.5.1 CMOS 电 路 


图 A-11 到 图 A-13 示 例 了 使 用 NMOS 技 术 实现 电路 的 一 般 结构 。 这 个 名 称 起 源 于 实现 逻辑 函 
数 的 晶体 管 是 NMOS 型 。 两 种 类 型 的 金属 饼 Vp=0V 
化 物 半 导体 可 以 作为 开关 使 用 。 一 个 n 沟 道 晶 
体 管 属于 NMOS 类 型 ， 当 它 的 门 输入 上 升 到 s: I 
EREHE EV upp 时 ， 表现 为 一 个 闭合 的 开 
关 ， 如 图 A-14a 所 示 。 相 反 的 表现 是 使 用 一 个 ` 
p 沟 道 的 晶体 管 ， 即 PMOS 类 型 。 当 门 电 平 Yc 本 
等 于 Vswppy 时 ， 它 相当 于 一 个 打开 的 开关 ， 而 时 闲 合 开关 打开 开关 
当 门 电 平 Ve = 0 时 , 它 相 当 于 一 个 闭合 的 开关 ， D NMOS BVK: 
如 图 A-14b 所 示 。 注 意 PMOS 晶 体 管 的 图 形 表 
示 在 其 门 输 入 处 有 一 个 圆圈 ， 表 示 它 的 行为 Vg= Vosppy Vp apply 
与 NMOS 晶 体 管 相 反 。 还 要 注意 PMOS 唱 体 管 
的 源 极 和 漏 极 名 称 也 相应 与 NMOS 唱 体 管 所 ve —4 
接 的 端 相 反 。NMOS 晶 体 管 的 源 极 是 接地 的 ， 


而 PMOS 晶 体 管 的 源 极 与 V ,wp 相连 。 这 些 | 

命名 习惯 是 根据 这 些 晶 体 管 中 的 电流 性 质 定 Vo Vp Vp = Vsupply 

义 的 当 Ve= Vapp 当 Vo=0V 时 
i 时 打开 开关 闭合 开关 


图 A-11 到 图 A-13 电 路 的 缺点 在 于 它们 的 
能 量 损耗 。 当 开关 闭合 以 提供 地 与 上 拉 电 阻 R 
之 间 的 通道 时 ， 有 电流 从 Vwpps 流向 地 。 在 相 
反 的 状态 下 ， 即 开关 打开 时 ,没有 到 地 的 通路 而 且 也 没有 电流 流 过 。(MOS 唱 体 管 的 门 端 没有 电 
流 流 过 )。 因 此 ， 根 据 门 的 状态 ， 在 逻辑 电路 中 可 能 会 出 现 明 显 的 能 量 损耗 。 

解决 能 量 损耗 问题 的 有 效 方 靶 是 同时 使 用 NMOS 和 PMOS 晶 体 管 来 实现 电路 ， 使 之 在 稳定 状 
态 下 不 消耗 能 量 。 这 种 方法 引出 了 CMOS (互补 金属 氧化 物 半导体 ) 技术 。 图 A-15 的 反 相 器 电路 
示例 了 CMOS 电 路 的 基本 思想 。 当 V, = Vowwy， 相 应 于 输入 x 的 逻辑 值 为 1， 唱 体 管 71 闭 合 而 打开 。 
因此 7; 将 输出 电 平 V 下 拉 到 0。 当 V, 变 为 0 时 ， 晶 体 管 四 打开 而 7 闭合 。 这 样 ， 7 将 输出 电 平 V 上 
拉 至 Vwo。 因 此 ，x 和 7/ 的 逻辑 值 互补 ， 电 路 实现 了 一 个 非 门 。 

这 个 电路 的 关键 特征 在 于 晶体 管 7 IT, 操作 是 完全 相反 的 : 当 一 个 是 打开 的 ， 另 一 个 就 是 
闭合 的 。 因 此 ， 从 输出 点 f 到 Vowps 或 地 总 有 一 条 闭合 的 通路 。 除了 晶体 管 转换 状态 时 非常 短 的 
过 渡 期 外 ， 和 任何 时 候 在 Vppy 和 地 之 间 都 没有 闭合 通路 。 这 表明 当 电 路 处 于 稳定 状态 时 并 不 消耗 
多 少 能 量 ， 仅 当 它 从 一 个 逻辑 状态 转变 到 另 一 个 逻辑 状态 时 消耗 能 量 。 因 此 ， 这 个 电路 的 能 量 
损耗 是 由 状态 转换 的 频率 决定 的 。 

现在 我 们 可 以 将 CMOS 的 概念 扩展 到 n 输 入 电路 ， 如 图 A-16 所 示 。 NMOS 唱 体 管用 来 实现 下 
拉 网 络 ， 当 所 需 函 数 F Ga, …, x.) 等 于 0 时 建立 输出 点 f 和 地 之 间 的 闭合 通路 。 上 拉 网 络 由 PMOS 


b) PMOS 品 体 管 
图 A-14 逻辑 电路 中 的 NMOS 和 PMOS 品 体 管 
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REER., MEARE (Xis Ka, x, ) 等 于 1 时 建立 输出 点 f FV upy 之 间 的 闭合 通路 。 上 拉 和 下 拉 
网 络 的 功能 是 相反 的 ， 因 此 在 稳定 状态 ， 输 出 点 f 和 Vswp 或 地 间 只 存在 一 和 闭合 通路 ， 而 不 是 
两 者 同时 存在 。 


Vsupply 


(x) V, 
x | v | T Tr,1 w | f 


ORJA R|] a|! 
1| 高 | 关 开 | |O 





a) 电路 b) 真 值 表 与 晶体 管状 态 
图 A-15 非 门 的 CMOS 实 现 


Vsuppty 





图 A-16 CMOS 电 路 结构 


下 拉 网 络 的 实现 方式 与 图 A-11 至 图 A-13 相 同 。 图 A-17 给 出 了 与 非 门 的 实现 ， 图 A-18 给 出 了 
或 非 门 的 实现 。 图 A-19 通 过 反 向 与 非 门 的 输出 实现 了 与 门 。 

除了 低能 量 损耗 ，CMOS 电 路 的 优点 还 有 MOS 晶 体 管 体积 很 小 ， 因 此 在 集成 电路 芯片 上 只 
占用 很 小 的 地 方 。 这 个 特性 有 两 个 显著 的 优势 。 首 先 ， 它 使 得 在 芯片 上 集成 百 万 个 晶体 管 成 为 1683 
可 能 ， 从 而 能 够 实现 现代 的 微 处 理 器 和 大 型 的 存储 芯片 。 其 次 ， 唱 体 管 的 体积 越 小 ， 它 从 一 个 
状态 到 另 一 个 状态 的 转换 就 越 快 。 因 此 ，CMOS 电 路 运行 速度 可 在 GHz 范围 内 。 

不 同 CMOS 电 路 运行 的 电 平 范围 在 1.5~15V 之 间 。 最 常用 的 电 平 值 是 5V 和 3.3V。 使 用 低 电 平 
的 电路 消耗 的 能 量 更 少 (能 量 消耗 约 与 Von 成 正比 )， 这 意味 着 可 以 在 一 块 芯片 上 放置 更 多 的 唱 
体 管 而 不 会 过 热 。 低 电 平 的 缺点 是 减 小 了 噪声 屏 项。 

CMOS 反 相 器 中 高 低 电 平 信号 问 传输 的 细节 如 图 A-20 所 示 。 粗 的 曲线 为 传输 特性 曲线 ， 显 示 
了 作为 输入 电 平 函数 的 输出 电 平 的 变化 。 这 一 曲线 表明 当 输 入 电 平 经 过 Vswpw /2 附近 时 ， 输 出 电 
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平 会 有 一 个 很 陡峭 的 变化 。 这 里 有 一 个 阅 值 电 平 多 和 一 个 小 的 6， 如 果 Va < VV-s， 则 Vow = Vsuppiys 
如 果 Vn >V,+ó, WIV,,= 0。 这 说 明 输出 正确 的 信号 时 ， 输 入 信和 号 不 一 定 严格 等 于 限定 电 平 值 0 或 
Vswpy。 输 入 信号 中 可 能 会 有 一 些 错 误 ， 即 噪声 ， 它 们 不 会 引起 不 利 的 效果 。 可 以 容忍 的 噪声 量 
称 为 噪声 容 限 。 当 输入 的 逻辑 值 为 1 时 ， 这 一 容 限 是 Vswppy (V+ 56)， 而 当 输 入 逻辑 值 是 0 时 ， 这 
一 容 限 是 V. - 6。CMOS 电 路 具有 出 色 的 噪声 容 限 。 


Vsupply 





a) 电 路 b) 真 值 表 和 晶体 管状 态 
图 A-17 与 非 门 的 CMOS 实 现 


V supply 





a) 电路 b) 真 值 表 和 晶体 管状 态 
684 图 A-18 或 非 门 的 CMOS 实 现 
在 本 节 中 我 们 介绍 了 CMOS 电 路 的 基本 特征 ， 读 者 如 想 了 解 此 技术 的 更 多 细节 ， 可 以 查阅 
参考 文献 [1] 和 [8]。 
A.5.2 传播 延迟 


逻辑 电路 不 能 够 立即 从 一 个 状态 转 到 另 一 个 状态 。 速 度 由 状态 变化 的 频率 来 衡量 。 一 个 相 








JE # ty 485 


关 的 参数 是 传播 延迟 ， 由 图 A-21 定 义 。 当 输入 的 状态 变化 后 ， 在 输出 做 出 相应 变化 之 前 有 一 个 
延迟 。 如 图 所 示 ， 通 常 传播 延迟 由 两 个 波形 转换 发 生 50% 了 时刻 之 间 的 时 间 长 度 衡 量 。 另 一 个 重要 
的 参数 是 转 撞 时 间 ， 通 常 测量 的 是 信号 幅度 为 10% 至 90% 点 之 间 的 时 间 长 度 ， 如 图 所 示 。 逻 辑 电 
路 运行 的 最 大 速度 随 着 电路 通过 不 同 路 径 传播 延迟 的 增加 而 减少 。 逻 辑 电路 中 任 一 通路 的 延迟 
是 此 通路 中 单个 门 延 迟 的 总 和 。 


V supply V supply 


Vy 


图 A-19 与 门 的 CMOS 实 现 
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V supply 
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图 A-20 CMOS 反 相 器 的 电 平 传输 特性 
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′ 转换 时 间 


输出 波形 





转换 时 间 
图 A-21 传播 延迟 和 转换 时 间 的 定义 


A.5.3 扇 入 扇 出 限制 


逻辑 门 的 输入 数 称 为 扇 入 〈fan-in)。 罗 辑 门 输出 驱动 的 门 输入 数 称 为 扇 出 〈fan-out)。 实 际 
电路 不 允许 大 的 扁 人 和 遍 出 ， 因 为 它们 都 对 传播 延迟 和 电路 速度 产生 不 利 的 影响 。 

CMOS 门 中 的 每 个 晶体 管 都 有 一 定 的 电容 。 当 电容 增加 时 ， 电 路 速度 会 变 慢 ， 而 且 信 和 号 电 平 
和 噪声 容 限 也 会 变 差 。 因 此 ， 需 要 对 遍 人 和 扁 出 进行 限制 ， 通 常 它 是 一 个 小 于 10 的 数 。 如 果 需 
要 的 输入 数 超过 了 最 大 的 扁 人 值 ， 必 须 再 使 用 一 个 同类 型 的 门 。 图 A-9a 显 示 了 两 个 同类 型 的 门 
如 何 级 联 。 如 果 必 须要 某 个 门 驱动 的 输出 端 数 超过 扇 出 数 ， 可 以 使 用 两 个 同类 型 的 |。 


A.5.4 三 态 缓冲 器 


在 目前 讨论 的 逻辑 门 中 ， 不 能 将 两 个 门 的 输出 连接 在 一 起 。 因 为 当 一 个 门 的 输出 值 是 1 而 另 
一 个 是 0 时 ， 我 们 不 能 确定 组 合 的 输出 信号 是 什么 值 ， 这 从 交 辑 角度 讲 是 没有 意义 的 。 更 重要 的 
是 ， 在 CMOS 电 路 中 ， 输 出 为 1 的 门 建立 了 一 条 从 输出 端 到 Vw 的 直接 通路 ， 而 输出 为 0 的 门 建 
立 了 到 地 的 通路 。 因 此 ， 这 两 个 门 会 形成 对 电源 的 短路 ， 从 而 对 门 造成 损坏 。 

但 是 ， 在 计算 机 系统 设计 时 ， 许 多 时 候 会 出 现 电 路 的 输入 信号 可 能 从 许多 不 同 的 源 中 获得 
的 情况 。 这 时 可 以 使 用 多 路 复 用 逻辑 电路 ， 这 个 内 容 将 在 A.10 节 中 讨论 。 也 可 以 使 用 三 态 缓冲 
器 的 特殊 门 来 实现 。 三 态 缓冲 器 具有 三 个 状态 。 其 中 的 两 个 状态 产生 普通 的 0 和 1 信号 。 第 三 个 
状态 将 缓冲 器 的 输出 端 置 于 高 阻抗 状态 ， 使 输出 在 电气 上 与 其 所 驱动 的 输入 断 开 。 | 

图 A-22 描 述 了 一 个 三 态 缓冲 器 。 这 个 缓冲 器 有 两 个 输入 和 一 个 输出 。 使 能 输入 e 控 制 缓冲 器 
的 操作 。 当 e = 1， 输 出 了 与 输入 x 具有 相同 的 逻辑 值 。 当 e = 0， 输 出 被 置 于 高 阻抗 状态 Z。 与 其 等 
效 的 电路 如 图 A-22b 所 示 。 图 中 三 角形 的 符号 代表 一 个 非 反 相 驱动 器 。 这 个 电路 没有 实现 任何 逻 
辑 操作 ， 因 为 它 的 输出 仅仅 复制 了 输入 信号 ， 目 的 是 提供 额外 的 电气 驱动 能 力 。 在 与 图 中 的 输出 
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开关 组 合 后 ， 它 的 行为 根据 图 A-22c 的 真 值 表 动 作 。 这 个 表 描 述 了 所 需 的 三 态 行为 。 图 A-22d 给 出 
了 三 态 缓冲 器 的 电路 实现 。 将 一 个 NMOS 晶 体 管 和 一 个 PMOS 唱 体 管 并 联 起 来 实现 一 个 开关 ， 与 
驱动 的 输出 连接 。 因 为 这 两 种 晶体 管 的 门 输入 端 需 要 相反 的 控制 信号 ， 所 以 要 使 用 一 个 反 相 器 。 
当 e = 0 时 ， 两 个 晶体 管 都 关闭 ， 相 当 于 一 个 打开 的 开关 ; 当 e = 1 时， 两 个 晶体 管 都 打开 ， 相 当 于 
一 个 闭合 的 开关 。 


a) 符号 b) 等 效 电路 





c) RAX d) 实现 
图 A-22 三 态 缓 促 器 


驱动 电路 必须 具有 能 驱动 大 量 其 他 门 输入 的 能 力 ， 这 些 门 的 总 容量 可 能 会 超过 普通 的 逻辑 
门 电路 的 驱动 能 力 。 为 了 提供 足够 的 驱动 能 力 ， 驱 动 电 路 需要 更 大 的 晶体 管 。 因 此 ， 实 现 驱动 
器 的 两 个 级 联 非 门 所 使 用 的 晶体 管 要 比 常规 逻辑 门 中 的 更 大 。 

读者 可 能 会 疑惑 为 什么 在 输出 开关 中 必须 使 用 PMOS 晶 体 管 ， 因 为 从 逻辑 函数 的 角度 来 看 ， 
只 使 用 NOMS 蝇 体 管 也 可 以 取得 相同 效果 。 这 样 做 的 原因 是 这 些 晶 体 管 必须 将 驱动 电路 产生 的 逻 
辑 值 “ 传 送 ” 到 输出 /， 而 结果 表明 NMOS 晶 体 管 能 很 好 地 传送 0 值 ， 但 对 1 值 的 效果 很 差 ， 而 
PMOS 晶 体 管 正好 相反 。NMOS 和 PMOS 的 并 联 能 够 很 好 地 传送 0 和 1 值 。 关 于 这 一 问题 和 三 态 组 
促 器 的 更 详细 讨论 ， 读 者 可 以 参阅 参考 文献 {1]。 


A.5.5 集成 电路 封装 


前 面 的 几 节 讨论 了 实现 逻辑 函数 的 电子 电路 的 主要 特征 。 在 实际 的 设计 中 ， 必 须 使 用 商业 
上 可 获得 的 集成 电路 (IC)。IC 于 20 世 纪 60 年 代 出 现 后 ， 一 种 以 标准 IC 芯片 为 形式 提供 逻辑 门 的 
趋势 发 展 很 快 。IC 芯 片 封装 在 密封 的 保护 性 外 过 中 ， 留 有 一 些 外 部 连接 用 的 金属 管 脚 。 标 准 的 
IC 封 装 有 不 同 数目 的 管 脚 。 图 A-23 是 一 个 简单 的 包含 4 个 与 非 门 的 封装 。 这 4 个 门 使 用 共同 的 电 
源 和 地 线 。 这 样 仅 包 括 几 个 逻辑 门 的 IC 称 作 小 规模 集成 (SSI) 电路 。 

与 它们 需要 的 物理 空间 相 比 ，SSI 电 路 所 提供 的 功能 太 少 了 。 另 外 ，IC 封 装 上 管 脚 的 电气 特 
征 使 得 它们 的 性 能 也 较 差 。 一 般 来 说 ， 需 要 使 用 更 大 的 晶体 管 提供 信号 ， 以 驱动 与 管 脚 连接 的 
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外 部 线路 。 这 就 增加 了 传播 延迟 和 了 能量 损 耗 。 


0.3 in 











b) 提供 4 个 2 输入 与 非 门 的 集成 电路 原理 图 
图 A-23 14 管 脚 集成 电路 封装 


689 图 A-23 中 IC 封装 中 CMOS 与 非 门 可 能 的 传输 延迟 是 5 纳 秒 。 但 是 ， 独 立 芯 片上 大 型 CMOS 网 
络 中 的 与 非 电 路 延迟 可 能 是 0 .2 纳 种 或 更 短 ， 这 取决 于 所 使 用 的 制造 工艺 。 
现在 有 许多 更 大 的 IC， 而 且 几 乎 所 有 的 逻辑 电路 都 是 用 这 些 芯片 实现 的 。 一 块 芯片 可 能 会 
实现 一 个 有 用 的 功能 块 ， 如 加 法 器 、 乘 法 器 、 编 码 器 或 译 码 器 。 但 是 它 也 可 能 只 提供 一 类 门 和 
可 编程 的 互 连 开 关 ， 这 样 设 计 者 就 能 用 它们 来 实现 各 种 各 样 的 功能 。 在 下 面 的 几 池 中 ， 我 们 将 
讨论 一 些 常用 的 功能 块 和 一 般 的 用 户 可 编程 逻辑 器 件 。 


A.6 触发 器 


大 部 分 数字 逻辑 的 应 用 都 需要 信息 的 存储 。 例 如 ， 控 制 密码 锁 的 电路 必须 记 住所 拨 数 字 的 
顺序 ， 以 便 确 定 是 否 要 打开 锁 。 另 一 个 重要 的 例子 是 数字 计算 机 中 的 内 存 保存 程序 和 数据 。 

存储 二 进 制 信息 的 基本 电子 元 件 称 为 镇 在 器 。 看 一 下 图 A-24a 中 两 个 交叉 耦合 的 或 非 门 。 让 
我 们 以 状态 R = 1，S = 0 开始 来 检测 一 下 此 电路 。 简 单 的 分 析 表 明 Q, = 0，Qs = 1。 在 这 种 情况 下 ， 
门 G。 的 两 个 输入 均 为 1。 这 样 ， 如 果 R 变 为 0，Q 和 Q 的 输出 不 会 有 任何 变化 。 如 果 S 设 置 为 1 而 R 
等 于 0，Q 和 Q 将 分 别 是 1 和 0， 而 且 将 会 保持 这 一 状态 直至 $S 变 回 0。 因 此 ， 这 个 逻辑 电路 构成 了 
一 个 存储 单元 或 锁 存 器 ， 它 记 下 了 两 个 输入 S 和 R 中 哪 一 个 最 接近 于 1。 图 A-24b 给 出 了 这 个 锁 存 
器 的 真 值 表 。 图 A-24c 显 示 了 锁 存 器 的 特征 波形 。 其 中 的 第 头 表明 了 信号 间 产 生效 果 的 关系 。 注 
意 当 输入 R 和 S 同 时 从 1 变 到 0 时 ， 结 果 状 态 是 不 确定 的 。 实 际 上 ， 锁 存 器 将 任意 假设 两 个 稳 态 中 
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的 一 个 。 输 入 值 R = S = 1 在 大 多 数 锁 存 器 中 不 使 用 。 

根据 前 面 电路 操作 的 性 质 ，R 和 S 线 称 作 置 位 和 复位 输入 。 由 于 通常 不 使 用 R = S = 1， 故 用 Q 
和 上 口 来 分 别 代替 Q, 和 Qs。 但 是 ，Q@ 只 是 代表 锁 存 器 第 二 个 输出 的 符号 ， 而 并 不 是 Q 的 反 ， 因 为 
输入 值 R = S = 1 的 结果 是 Q=Q=0。 





一 — ol 


R 
0 | o1 10 (不 变化 ) 
1 
0 
1 





Q, 
0 
1 
Q, 
0 
c) 时 序 图 
图 A-24 使 用 或 非 门 实现 的 基本 锁 存 器 
A.6.1 (HARER 


许多 应 用 需要 有 R 和 S 以 外 的 输入 控制 锁 存 器 置 位 或 复位 的 时 间 ， 这 个 输入 称 为 时 钟 。 组 合 
的 结果 称 作 门 榨 SR 镇 存 器 。 该 锁 存 器 的 逻辑 电路 、 真 值 表 、 波 形 特性 和 图 形 符号 如 图 A-25 所 示 . 
当时 钟 Ch 等 于! 时 ，S“ AAR 点 的 值 等 于 S 和 R。 另 一 方面 ， 当 CI = 0 时 ，S' ARR 点 均等 于 0， 
并 且 锁 存 器 不 会 发 生 任何 状态 变化 。 

至 此 我 们 已 经 使 用 真 信 表 找 述 了 远 辑 电路 的 行为 。 真 值 表 给 出 了 一 个 电路 与 各 种 输入 值 相 
对 应 的 输出 。 每 个 输入 值 惟一 地 定义 输出 的 逻辑 电路 为 组 合 电 路 。 这 是 在 A.1 到 A.4 节 中 讨论 的 一 
类 电路 。 当 出 现存 储 元 件 后 ， 我 们 得 到 了 一 种 不 同 种 类 的 电路 。 这 种 电路 的 输出 函数 不 只 取决 
于 输入 变量 的 当前 值 ， 还 反映 了 输入 变量 以 前 的 行为 。 图 A-24 给 出 的 就 是 这 样 一 个 例子 。 这 种 
类 型 的 电路 称 为 时 序 电路 。 

由 于 存储 的 特性 ， 锁 存 器 的 真 值 表 需 要 修改 ， 以 显示 当前 状态 所 产生 的 影响 。 图 A-25b 找 述 
了 门 控 SR 触发 器 的 行为 ， 其 中 Q (0 代表 它 的 当前 状态 。 到 下 一 个 状态 Q G + D 的 转换 发 生 在 一 个 
时 钟 脉冲 之 后 。 注 意 当 输入 值 为 S =R = 1 时 ， 由 于 前 面 讨论 的 原因 ，Q G + 1) 的 值 是 不 确定 的 。 
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d) 图 形 符号 
图 A-25 门 控 SR 锁 存 器 


0 
1 
1 
1 
1 





Q (不 变化 ) 
Q (不 变化 ) 
0 


如 图 A-26， 门 控 SR 锁 存 器 可 以 用 与 非 门 实现 。 这 是 一 个 有 用 的 例子 ， 可 以 证 明 这 个 电路 在 


功能 上 等 效 于 图 A-25a 中 的 电路 (参见 习题 A.20)。 

第 二 种 类 型 的 门 控 锁 存 器 称 作 门 控 D 锁 存 器 ， 如 图 
A-27 所 示 。 在 这 种 情况 下 ，S 和 RR 两 个 信号 是 从 单一 输入 
D 导 出 的 。 在 一 个 时 钟 脉冲 中 ， 如 果 D = 1， 输 出 Q 被 置 
位 为 1， 或 当 D = 0 输出 被 复位 为 0。D 触 发 器 当时 钟 为 高 
电 平时 采样 输入 D 的 值 并 储存 该 值 ， 直 到 下 一 个 时 钟 肪 
冲 到 来 。 ' 


A.6.2 主 从 触发 器 


S 


Clk 


Q 
R 


图 A-26 使 用 与 非 门 实现 门 控 SR 锁 存 器 


在 图 A-25 的 电路 中 ,假设 当 CK = 1 时 ,输入 S 和 R 不 发 生 改 变 。 考 察 电路 会 发 现 ， 在 这 个 时 
间 内 ， 不 管 输入 S 和 R 发 生 任 何 变化 ， 输 出 都 会 立即 做 出 响应 。 类 似 地 ， 在 图 A-27 的 电路 中 ， 当 
Cik = 1 时 ，Q = D. 在 许多 情况 下 ， 这 种 情况 不 是 我 们 想 要 的 ， 尤 其 是 对 于 包含 计数 器 和 移 位 寄 
存 器 的 电路 ， 这 些 以 后 再 讨论 。 在 这 样 的 电路 中 ， 将 逻辑 条 件 立即 从 数据 输入 端 (R、S 和 D) f 
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a) 电路 
Cik D Q(t +1) D Q 
0 x Q(z) 
1 0 0 Cik Q 
1 1 1 
b) HEK c) 图 形 符号 








— 时 间 


中 时 序 图 
BJA-27 门 控 D 锁 存 器 


递 到 锁 存 器 的 输出 往往 导致 错误 的 操作 。 主 从 结构 解决 了 这 个 问题 。 如 图 A-28a， 两 个 门 控 D 锁 
存 器 可 以 连接 成 一 个 主 从 D 和 触发 器 。 首 先 ， 看 一 下 主 触 发 器 部 分 ， 当 Clock = 1 时 与 输入 D 相 连 。 
时 钟 从 1 到 0 的 跳 变 使 主 触发 器 与 输入 断 开 ， 并 将 主 触发 器 中 存储 的 内 容 传 送 到 从 触发 器 。 我 们 
可 以 看 到 ， 在 输入 D 和 输出 Q 间 任何 时 候 都 不 存在 直接 的 通路 。 

需要 注意 的 是 ， 当 Clock = 1] 时 ， 主 触发 器 的 状态 直接 受到 输入 D 变 化 的 影响 。 从 触发 器 的 功 
能 是 在 主 触发 器 准备 接收 由 输入 D 决 定 的 下 一 个 状态 值 时 ， 保 持 触发 器 的 输出 值 。 时 钟 从 1 到 0 的 
跳 变 结束 后 ， 新 状态 就 从 主 触发 器 传送 到 从 触发 器 。 这 时 ， 主 触发 器 已 经 与 输入 断 开 ， 因 此 输 
A D 的 任何 变化 都 不 会 影响 传送 过 程 。 状 态 转换 的 例子 如 图 A-28b 的 时 序 图 所 示 。 

触发 器 是 指 一 种 在 控制 时 钟 信 号 的 边缘 改变 状态 的 存储 元 件 。 在 前 面 讨论 的 主 从 D 触 发 器 中 ， 
在 时 钟 的 下 降 沿 (1 到 0) 发 生 明 显 的 变化 。 当 变化 达到 从 触发 器 的 Q 端 时 ， 就 可 以 观察 到 该 变化 。 
注意 在 图 A-28 的 电路 中 ， 也 可 以 使 用 反 向 的 时 钟 信 号 控制 主 触发 器 ， 而 用 原 时 钟 控制 从 触发 器 。 
这 时 ， 触 发 器 输出 Q 变化 就 会 在 时 钟 的 上 升 沿 发 生 。 

图 A-28c 给 出 了 触发 器 的 图 形 符号 。 我 们 使 用 一 个 箭头 来 代替 标签 C 克 定义 此 触发 器 的 时 钟 输 
入 。 这 是 定义 触发 器 上 升 沿 触发 状态 变化 的 标准 表示 方法 。 在 我 们 的 图 中 是 下 降 沿 触发 状态 变 
化 的 ， 因 此 在 时 钟 输入 端 (箭头 之 外 ) 再 画 一 个 小 圆 轩 。 
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c) 图 形 符号 
图 A-28 主 从 D 触 发 器 


A.6.3 边沿 触发 


如 果 输 入 端的 数据 只 在 时 钟 信号 跳 变 时 传送 给 输出 端 ， 我 们 就 说 触发 器 是 边沿 触发 的 。 在 
其 他 所 有 时 间 输 入 与 输出 都 是 断 开 的 。 上 升 沿 (前 沿 ) 触发 和 下 降 洛 (后 沿 ) 触发 分 别 描述 了 
数据 传送 发 生 在 0 到 1 和 1 到 0 时 钟 跳 变 的 触发 器 。 为 了 进行 正确 的 操作 ， 边 沿 触发 的 触发 器 要 求 
时 钟 脉冲 的 触发 沿 定 义 明确 并 且 跳 变 时 间 很 短 。 图 A-28 中 的 主 从 触发 器 是 一 个 下 降 沿 触发 器 。 

下 降 襄 触 发 D 触 发 器 的 另 一 种 实现 如 图 A-29a。 让 我 们 看 一 下 这 个 触发 器 的 操作 过 程 。 如 果 
Clk = 1， 门 2 和 3 的 输出 均等 于 0。 因 此 ， 触 发 器 输出 Q 和 Q 维持 触发 器 的 当前 状态 。 容 易 验 证 在 
这 段 时 间 内 ，?3 点 和 P4 点 会 立即 响应 D 的 变化 。P3 点 保持 与 五 相等 ， 而 P4 点 保持 与 D 相 等 。 当 
Clk 下降 为 0 时 ， 这 些 值 通过 门 2 和 3 分 别传 送 到 P1 和 P2。 因 而 ， 由 门 5 和 6 组 成 的 输出 锁 存 器 得 到 
了 需要 储存 的 新 状态 。 

我 们 现在 验证 一 下 当 CIk = 0 时 ，D 的 变化 不 会 改变 P1 点 和 P2 点 。 考 虑 两 种 情况 。 首 先 ， 假 设 
在 CU 的 下 降 沿 D = 0。P2 处 的 1 在 门 2 和 4 都 保持 输入 为 1， 这 使 得 P1 和 P2 为 0 和 1， 与 D 的 任何 变化 
无 关 。 其 次 ， 假 设 在 CK 下 降 治 D = 1。P1 处 的 1 表明 D 的 任何 变化 都 不 会 影响 到 门 1， 门 1 保持 为 0。 
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b) 时 序 举例 
图 A-29 下 降 沿 触发 的 P 触 发 器 


当下 一 个 时 钟 脉 冲 开 始 时 C 克 上升 为 1，P1 点 和 P2 点 再 一 次 被 强制 置 0， 使 输出 与 电路 的 其 他 
部 分 断 开 。P3 点 和 P4 点 跟随 D 的 变化 而 变化 ， 如 我 们 前 面 所 描述 的 一 样 。 

这 种 D 触 发 器 的 操作 示例 如 图 A-29b。 触 发 器 在 C 区 从 1 到 0 跳 变 时 所 得 的 状态 等 于 在 这 一 跳 变 
之 前 输入 D 的 值 。 但 是 ， 在 CK 下降 沿 附近 存在 一 个 临界 时 间 段 Tr， 其 间 D 上 的 值 不 应 改变 。 如 
图 所 示 ， 这 段 时 间 分 为 两 部 分 :时钟 边沿 前 的 建立 时 间 和 时 钟 边沿 后 的 保持 时 间 。 时 序 图 显示 
输出 Q 在 有 时钟 下 降 沿 过 后 稍 晚 一 些 才 有 变化 。 这 是 由 于 受到 了 与 非 门 传输 延迟 的 影响 。 


A.6.4 T 触 发 器 


使 用 最 为 广泛 的 触发 器 是 D 触 发 器 ， 因 为 它们 对 数据 的 临时 存储 很 有 有 用。 但是， 在 一 些 应 用 
中 ， 使 用 其 他 类 型 的 触发 器 会 很 方便 。 在 A.8 节 中 讨论 的 计数 器 电路 就 是 由 T 触 发 器 构成 的 。 当 
其 输入 T 等 于 1 时 ， 了 触发 器 在 每 个 时 钟 周期 都 改变 状态 。 我 们 称 它 “翻转 ”自己 的 状态 。 

图 A-30 显 示 了 T 触 发 器 。 如 图 A-30a 所 示 ， 它 的 电路 从 D 触 发 器 得 来 。 图 中 还 给 出 了 它 的 真 值 
表 、 图 形 符号 以 及 时 序 图 举例 。 注 意 现在 假设 的 是 一 个 上 升 沿 触发 的 触发 器 。 
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T IQ(t+1) 
0 Qi) 
1 Qie) 





b) 真 值 表 





d) 时 序 图 
图 A-30 T 触 发 器 


A.6.5 ”JK 触发 器 


在 实际 中 会 遇 到 的 另 一 种 触发 器 是 下 触发 器 ， 它 组 合 了 SR 触发 器 和 T 触 发 器 的 功能 ， 如 图 
A-31 所 示 。 它 的 操作 由 图 A-31b 中 给 出 的 真 值 表 定义 。 表 中 的 前 三 行 定义 了 与 图 A-25b ( 当 Clk = 1 
时 ) 中 一 样 的 表现 ， 所 以 J 和 K 分 别 对 应 S 和 RR。 当 输入 值 ] = K = 1 时 ， 下 一 个 状态 定义 为 与 当前 
触发 器 相反 的 状态 。 即 当 J=K = 1， 触 发 器 的 功能 就 像 是 一 个 开关 ， 翻 转 当前 的 状态 。 

开 触 发 器 可 以 使 用 DD 触发 器 联结 成 

D=JQ + KQ 
实现 。 相 应 的 电路 如 图 A-31a 所 示 。 

琅 触 发 器 可 以 有 多 种 用 途 .。 它 可 以 像 D 触 发 器 一 样 用 来 存储 数据 。 它 也 可 以 用 来 构造 计数 器 ， 
因为 当 J 和 K 输 入 连 在 一 起 时 ， 就 表现 为 一 个 T 触 发 器 。 
A.6.6 带 预 置 和 清除 的 触发 器 

触发 器 的 状态 由 它 的 当前 状态 和 输入 端的 逻辑 值 决定 。 有 时 需要 强制 将 触发 器 置 于 某 个 特 
定 状 态 0 或 1， 而 不 管 它 的 当前 状态 和 正常 输入 值 是 什么 。 例 如 ， 当 打开 计算 机 时 ， 需 要 将 所 有 


的 触发 器 都 置 于 一 个 已 知 状态 。 通 常 是 将 它们 的 输出 复位 为 0 状态 。 有 些 时 候 也 需要 将 一 些 触 发 
器 置 为 1 状态 。 
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Clock 





b) 真 值 表 c) 图 形 符号 
图 A-31 玖 触发 器 


图 A-32 显 示 了 如 何 将 预 置 和 清除 控制 输入 加 到 主 从 D 触 发 器 上 ， 不 管 D 输 入 和 时 钟 是 什么 ， 
都 将 触发 器 强制 置 为 1 或 0。 图 中 的 上 划 线 和 圆 艾 显示 这 些 输入 是 低 电 平 有 效 的 。 当 预 置 ( Preset) 
和 清除 (Ciear ) 输入 都 等 于 1 时 ， 触 发 器 就 在 正常 情况 下 由 时 钟 和 D 输 入 控制 。 当 Prese Fott, 
触发 器 强 置 于 1 状态 。 而 当 Glear = 0 时 ， 触 发 器 强 置 于 0 状态 。 在 其 他 类 型 的 触发 器 中 也 常常 加 入 
预 置 和 清除 控制 。 











Preset 





Clear 


b) 图 形 符 号 
图 A-32 带 预 置 和 清除 的 D 触 发 器 
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A.7 寄存 器 与 移 位 寄存 器 


每 个 触发 器 可 以 用 来 存储 一 位 数据 。 但 是 ， 在 用 字 处 理 数据 的 机 器 中 ， 字 由 许多 位 组 成 
(可 能 是 64 位 )。 为 了 处 理 数据 的 方便 ,我们 将 许多 多发 器 组 合 为 一 种 常用 的 结构 ， 称 为 寄存 器 。 
寄存 器 中 所 有 触发 器 的 操作 都 由 共同 的 时 钟 控 制 。 因 此 ， 数据 被 写 人 〈 载 人 ) 触发 器 或 从 触发 
器 中 读 出 都 同时 进行 。 

处 理 数字 数据 经 常 要 求 有 移 位 和 循环 数据 的 能 力 ， 因 此 需要 提供 有 此 能 力 的 硬件 。 能 实现 
这 两 种 操作 的 简单 器 件 是 寄存 器 ， 其 内 容 可 以 每 次 向 左 或 向 右 移 动 一 位 。 例 如 图 A-33 中 的 4 位 移 
位 寄存 器 。 它 是 由 D 和 触发 器 连接 成 的 ， 故 每 个 时 钟 脉冲 会 引起 从 FE; 到 Fi ,的 内 容 (状态 ) 传递 ， 
表现 为 “ 右 移 " 。 数 据 被 顺序 送 入 或 送出 寄存 器 ， 将 输出 接 至 输入 可 以 实现 数据 的 循环 。 





图 A-33 简单 的 移 位 寄存 器 
移 位 寄存 器 的 正确 操作 要 求 其 内 容 在 每 个 时 钟 脉 冲 恰好 移动 一 位 。 这 就 限制 了 可 以 使 用 的 
存储 元 件 类 型 。 图 A-27 描 述 的 门 控 锁 存 器 不 适合 实现 此 操作 。 当 时 钟 为 高 电 平时 ，D 输 入 的 值 很 
快 就 传送 到 输出 。 接 着 ， 数 据 又 以 相同 的 方式 经 过 下 一 个 门 控 锁 存 器 。 因 此 ， 在 一 个 时 钟 脉冲 
内 不 能 控制 移 位 发 生 的 次 数 。 这 个 次 数 由 门 控 锁 存 器 的 传输 延迟 和 时 钟 脉冲 的 持续 时 间 决 定 。 

解决 这 个 问题 的 办 法 是 使 用 主 从 或 边沿 触发 器 。 

可 以 并 行 载 和 人 和 读 取 的 移 位 寄存 器 是 很 实用 的 。 这 可 以 使 用 一 些 附 加 的 门 实现 。 如 图 A-34， 

并 行 输出 





HA Shi/Load ~ an Clock 


图 A-34 并 行 访问 的 移 位 寄存 器 
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它 显 示 了 用 D 触 发 器 构成 的 4 位 寄存 器 。 这 个 寄存 器 可 以 串 行 或 并 行 地 载 信 。 当 计时 开始 时 ， 如 
果 Shift /Load = 0 就 发 生 移 位 ; 否则 ， 发 生 并 行 载 入 。 


A.8 计数 器 


在 前 面 的 一 节 中 ， 我 们 讨论 了 触发 器 在 构造 移 位 寄存 器 时 的 应 用 。 它 们 在 实现 计数 器 电路 
时 也 同样 有 用 。 计 数 器 在 数字 机 器 中 的 重要 性 无 需 多 言 。 除 了 作为 具有 一 般 计 数 功 能 的 硬件 设 
备 外 ， 计 数 器 还 被 用 来 产生 控制 和 时 序 信号 。 由 高 频 时 钟 驱动 的 计数 器 可 以 产生 频率 为 原始 时 
钟 分 频 的 信号 。 在 这 样 的 应 用 中 计数 器 作为 定 标 器 使 用 。 

图 A-35 显 示 了 由 T 触 发 器 构成 的 一 个 简单 的 3 段 (或 3 位 ) 计数 器 。 回 忆 一 下 当 T 输 入 等 于 1 时 ， 
触发 器 表现 为 一 个 开关 ， 即 每 个 连续 的 时 钟 脉 冲 都 会 引起 状态 的 变化 。 因 此 ， 两 个 时 钟 脉冲 将 
会 使 Qo 从 ! 状 态 变 为 0 状态 再 回 到 1 状态 ， 或 说 从 0 到 1 再 到 0。 这 说 明 Qo 输出 波形 的 频率 是 时 钟 频 
率 的 一 半 。 类 似 地 ， 因 为 第 二 个 触发 器 是 由 Qo 驱动 的 ， 所 以 Q, 的 波形 是 Qo 频率 的 一 半 ， 或 者 是 
时 钟 频率 的 1/4。 注 意 我 们 假设 每 个 触发 器 的 状态 都 在 时 钟 输入 的 上 升 沿 发 生 改变 。 





a) 电路 








b) 时 序 图 
图 A-35 3 位 开 值 计数 器 


这 样 的 计数 器 常 被 称 作 行 波 计数 器 ， 因 为 输入 时 钟 脉冲 的 影响 像 行 波 一 样 通过 计数 器 。 例 
如 ， 脉 冲 4 的 上 升 沿 将 Qo 的 状态 从 1 变 到 0。Qo 的 这 个 变化 会 迫使 QI 从 1 变 到 0， 而 后 按 师 序 迫 使 Q。 
从 0 到 1。 如 果 每 个 触发 器 产生 的 延迟 为 A&， 则 Q: 的 延迟 就 是 3A。 当 要 求 计 数 器 高 速 运行 时 ， 这 
样 的 延迟 就 会 成 为 一 个 问题 。 但 在 许多 应 用 中 ， 这 些 延 迟 与 时 钟 周 期 相 比 非常 小 ， 因 而 可 以 被 
忽略 。 

增加 一 些 附 加 的 逻辑 门 ， 就 可 以 构建 一 个 “同步 ”计数 器 ， 其 每 个 阶段 都 在 公用 时 钟 控 制 
之 下 ， 因 此 所 有 触发 器 可 以 同时 改变 状态 。 因 为 总 的 延迟 显著 减少 ， 所 以 这 样 的 计数 器 可 以 高 
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速 运行 。 与 之 相反 ， 图 A-35 的 计数 器 被 称 为 “异步 ”计数 器 。 
A.9 Wasa 


计算 机 中 的 许多 信息 都 被 保存 为 编码 格式 。 在 指令 中 ， 一 个 “位 字段 可 以 用 来 表示 从 2 种 可 
能 的 动作 挑 出 一 个 去 执行 。 为 了 执行 所 需 的 操作 ， 编 码 指令 必须 先 被 译 码 。 能 够 接受 "变量 输入 
并 在 2 个 输出 线路 中 产生 一 个 相应 输出 信号 的 电路 称 作 译 码 器 。 图 A-36 给 出 了 一 个 2 输入 4 输出 
的 简单 译 码 器 的 例子 。 如 图 所 示 ，4 条 输出 线路 由 输入 x! 和 xz 选择 出 一 个 。 被 选 出 的 输出 具有 多 
辑 值 1， 剩 下 的 输出 值 都 是 0。 


Xi 





x 
图 A-36 2 输入 4 输出 译 码 器 


译 码 器 还 存在 其 他 形式 。 例 如 ， 使 用 BCD 码 的 信息 经 常 需要 一 个 具有 4 变量 BCD 输 入 的 译 码 
电路 ， 它 能 从 10 个 可 能 的 输出 中 选择 1 个 有 效 输出 。 考 虑 另 一 个 具体 的 例子 ， 一 个 能 够 驱动 七 段 
显示 器 的 译 码 器 。 图 A-37 给 出 了 用 于 显示 的 七 段 元 件 的 结构 。 容 易 看 出 ， 从 0 到 9 的 任意 十 进 制 
数 都 可 以 通过 打开 一 些 段 ( 亮 ) 而 关闭 另 一 些 段 (上 暗 ) 的 方式 显示 出 来 。 表 中 给 出 了 一 些 必要 
的 函数 。 它 们 可 以 使 用 图 中 的 译 码 器 电路 实现 。 注 意 这 个 电路 是 由 与 非 门 组 成 的 。 希 望 读者 自 
己 验证 该 电路 实现 了 所 需 的 功能 。 


A.10 多 路 复 用 器 


在 前 面 一 节 中 ， 我 们 看 到 译 码 器 根据 输入 信号 选择 一 条 输出 线 。 被 选中 的 输出 线 逻 辑 值 为 1， 
而 其 他 输出 均 为 0。 另 一 种 非常 有 用 的 选择 电路 能 够 从 "个 数据 输入 中 选择 一 个 作为 输出 。 选 择 
操作 是 由 一 组 “选择 ”输入 控制 的 。 这 样 的 电路 称 作 多 路 复 用 器 。 图 A-38 给 出 了 一 个 多 路 复 用 
器 电路 的 例子 。 它 有 两 个 选择 输入 端 ，w1 和 w, 。 它 们 的 4 个 可 能 值 用 来 选择 4 个 输入 x1、 避 、% 或 
+， 作 为 输出 z。 图 中 也 给 出 了 能 够 实现 所 需 操作 的 简单 逻辑 电路 。 显然， 相同 的 结构 可 以 实现 
更 大 的 多 路 复 用 器 ， 用 k 个 选择 输入 端 将 2: 个 数据 输入 端 中 的 一 个 连接 到 输出 。 

多 路 复 用 器 的 一 个 常见 应 用 是 筛选 可 能 来 自 许 多 不 同 源 的 数据 。 例 如 ， 从 4 个 数据 源 加 载 一 
个 16 位 数据 寄存 器 可 以 用 16 个 4 输入 多 路 复 用 器 实现 。 

多 路 复 用 器 也 可 作为 实用 的 基本 元 件 用 来 实现 逻辑 函数 。 考 虑 由 图 A-39 的 真 值 表 定义 的 函 
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No. moan abcdefg 
0 0000 1111110 
1 0001 0110000 
b 2 0010 1101101 
3 0011 1111001 
1 4 0100 0110011 
|° 5 0101 1011011 
6,0110 1011111 
7 0111 1110000 
g 1000 1111111 
9 1001 1111011 


l 


L S 
eH p Dee 
-p 

TT 
-Es > 


图 A-37 BCD 码 七 段 显 示 器 译 码 器 


数 f/。 如 图 ， 它 可 以 用 提取 的 变量 x, 和 x 代表 。 注 意 对 1 和 x 的 每 个 值 ， 函 数 1 对 应 于 4 项 中 的 一 个 : 
0、1、 为 或 xs。 这 意味 着 可 以 使 用 一 个 4 输入 多 路 复 用 器 电路 ， 其 中 心 、 六 是 选择 4 个 数据 输入 之 
一 的 选择 输入 端 。 这 样 ， 如 果 将 0、1、x 和 xs 按照 真 值 表 的 要 求 过 接 到 数据 输入 ， 则 多 路 复 用 
器 的 输出 就 是 函数 f。 这 种 方法 完全 是 通用 的 。 任 何 3 变量 函数 都 可 以 由 一 个 4 输入 多 路 复 用 器 实 
现 。 类 伏地 ， 任 何 4 变量 的 函数 都 可 以 由 一 个 8 输入 多 路 复 用 器 实现 ， 依 次 类 推 。 
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图 A-38 4 输入 多 路 复 用 器 
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00010 
0 0 1 0 
0 10/10 
01 1 1 
1 9 O 1 
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图 A-39 用 多 路 复 用 器 实现 逻辑 函数 





0 


A.11 可 编程 逻辑 器 件 (PLD) 


A.2 节 和 A.3 节 表明 了 给 定 的 开关 函数 可 以 由 积 之 和 表达 式 表示 、 并 可 以 使 用 相应 的 与 或 门 网 
络 实现 。A.10 节 介绍 了 如 何 使 用 多 路 复 用 器 实现 开关 函数 。 在 这 一 节 中 ， 我 们 将 要 考虑 另外 一 
种 能 实现 同样 功能 的 电路 。 这 些 电路 由 一 系列 开关 元 件 构成 ， 可 以 通过 编程 实现 积 之 和 表达 式 ， 
它们 称 作 可 编程 逻辑 器 件 (PLD)。 

图 A-40 给 出 了 PLD 的 框图 。 它 有 a 个 输入 变量 《x…, x.) 和 m 个 输出 函数 (有, …, Sa) BAR 
数 /都 由 包含 输入 变量 的 积 之 和 项 组 成 。 变 量 x, … 的 真 值 或 反 值 形式 送 入 与 阵列 ， 形 成 个 乘积 
项 。 然 后 这 些 乘积 项 被 送 入 或 阵列 ， 形 成 输出 防 数 。 两 种 普遍 使 用 的 PLD 类 型 在 本 节 后 面 讨论 。 





图 A-40 PLD 的 框图 


A.11.1 可 编程 逻辑 阵列 (PLA) 


如 果 电 路 同 与 阵列 、 或 阵列 的 连接 是 可 编程 的 ， 则 该 电路 称 为 可 编程 远 辑 阵列 (PLA), EU 
A-41 用 简单 的 例子 说 明了 PLA 的 功能 结构 。 当 可 编程 连接 没有 同 与 门 给 出 的 输入 相连 时 ， 该 输入 
会 表现 为 好 像 是 逻辑 1 在 驱动 它 一 样 (该 输入 对 这 个 门 实现 的 乘积 项 不 起 作用 )。 类 似 地 ， 如 果 
没有 同 或 门 给 出 的 输入 相连 时 ， 读 输入 对 这 个 门 的 输出 没有 任何 影响 (该 输入 会 表现 为 好 像 是 
逻辑 0 在 驱动 它 一 样 )。 

可 编程 连接 可 以 用 不 同 的 方法 突现。 一 种 方法 是 ， 熔 断 不 需 连 接 位 置 的 金属 丝 。 这 需要 使 
用 高 于 常 值 的 电流 。 另 一 种 可 行 方 法 是 使 用 可 按 除 存储 元 件 (参见 5. 3 节 的 EPROM 存 储 电 路 ) 控 
制 的 晶体 管 开关 来 提供 所 需 的 连接 。 这 也 使 得 PLA 可 以 重新 编程 。 

图 A-41 中 简单 的 PLA 可 以 从 3 个 输入 变量 生成 4 个 乘积 项 。 使 用 这 些 乘积 项 可 以 实现 两 个 输出 
函数 。 有 些 乘 积 项 可 以 被 不 止 一 个 输出 函数 使 用 。PLA 实 现 了 下 面 两 个 函数 : 

fi=x + Xi X3 + X i X2X3 
J: = x + XX + X 1 X 255 
在 两 个 函数 中 有 两 个 相同 项 ， 因 此 只 需要 4 个 乘积 项 。 实 际 应 用 中 的 PLA 规 模 要 大 得 多 。 
尽管 图 A-41 清 楚 地 描述 了 PLA 的 基本 功能 ， 但 这 种 表示 形式 对 于 更 大 的 PLA 就 显得 有 些 笨拙 
了 。 在 科技 文献 中 已 经 形成 一 个 惯例 ， 使 用 只 有 一 条 输入 线 的 相应 门 符号 来 表示 乘积 项 和 求 和 
项 。 对 于 每 个 已 编程 连接 在 该 线 上 打 一 个 叉 号 “x ”。 图 A-42 使 用 这 种 图 示 方 法 表示 了 图 A-41 中 


705 


~] 





502 


HRA 


PLA 的 例子 。 通 常 ， 为 了 实现 输入 变量 的 任意 函数 ， 图 中 任何 垂直 线 和 水 平 线 的 交点 都 可 以 是 一 


个 可 编程 的 连接 。 


xi 


x 






HL U HL 1 
w A A 








| 
| 
| 
:| SFH 
| 
| 





f = XIX; + X |X3 + XI XX 


f,= x% + X,X>X3 + X| Xs 


图 A-41 PLA 的 功能 结构 


图 A-42 图 A-41 中 PLA 的 简化 图 
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就 其 在 集成 电路 芯片 上 实现 所 需 的 空间 而 言 ，PLA 的 结构 是 十 分 高 效 的 。 出 于 这 种 原因 ， 在 
处 理 器 芯片 上 经 常 使 用 这 样 的 结构 来 实现 控制 电路 。 这 时 ， 制 造 过 程 的 最 后 一 步 就 是 做 好 所 需 
的 连接 ， 而 制造 出 芯片 后 再 使 它们 可 编程 。 


A.11.2 可 编程 阵列 逻辑 (PAL) 


在 PLA 中 ， 与 阵列 、 或 阵列 的 输入 都 是 可 编程 的 。 在 实际 应 用 中 大 量 应 用 了 一 种 相似 设备 ， 
与 阵列 的 输入 是 可 编程 但 同 或 门 的 连接 是 固定 的 。 这 样 的 设备 称 作 可 编程 阵列 逻辑 (PAL) 芯片 。 

图 A-43 给 出 了 实现 两 个 函数 的 PAL 的 简单 例子 。 每 个 或 门 所 连接 的 与 门 数 量 决定 了 给 定 函 数 
积 之 和 表达 式 中 乘积 项 的 最 大 数目 。 与 门 与 特定 的 或 门 永久 地 保持 连接 ， 这 意味 着 在 输出 函数 
中 不 能 共享 乘积 项 。 








f = X |X2X; + X XX 


f>= X1X2+ x XX 
图 A-43 PAL 举 例 


PAL 必 片 在 许多 结构 中 都 可 使 用 。 提 供 足 够 数量 的 输入 变量 和 输出 函数 ， 就 能 实现 大 规模 的 
冰 数 。 或 门 的 输出 若 连 接触 发 器 ， 会 使 PAL 具 有 更 多 功能 。 这 样 的 PAL 芯 片 使 数字 系统 设计 师 能 
够 使 用 一 块 芯片 实现 比较 复杂 的 逻辑 网 络 。 

图 A-44 显 示 了 电路 的 灵活 性 。 多 路 复 用 器 用 来 选择 在 PAL 芯 片 输出 管 脚 表示 的 / 是 真 值 、 反 
值 还 是 储存 值 ( 从 前 一 个 时 钟 周 期 得 出 )。 多 路 复 用 器 的 选择 输入 可 以 设置 为 可 编程 的 连接 。 输 
出 管 脚 在 输出 使 能 信号 控制 下 由 三 态 驱 动 器 驱动 。 注意 多 路 复 用 器 的 输出 信号 还 可 作为 内 部 输入 ， 
用 来 对 PAL 中 的 其 他 或 门 提供 乘积 项 。 这 使 得 具有 多 个 层次 〈 阶 段 ) 逻辑 门 的 电路 容易 实现 。 
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输出 使 能 







乘积 及 内 部 输入 


图 A-44 PAL 元 件 输出 举例 


A.11.3 复杂 可 编程 逻辑 器 件 (CPLD) 


PAL 是 很 有 用 的 器 件 ， 但 是 它们 比较 小 ， 这 意味 着 要 实现 一 个 典型 的 数字 系统 需要 很 多 这 
样 的 芯片 。 为 了 解决 这 一 问题 ， 人 们 开发 出 了 相似 类 型 的 较 大 器 件 。 这 就 是 复杂 可 编程 逻辑 器 
件 (CPLD)。 这 些 器 件 包括 两 个 或 更 多 的 类 PAL 块 和 可 编程 互 连 线 。 图 A-45 给 出 了 CPLD 芯片 的 
结构 。 每 个 类 PAL 块 都 与 许多 输入 /输出 管 脚 相连 。 类 PAL 块 的 连接 通过 对 与 互 连 线 相关 联 的 开关 
编程 来 建立 。 

互 连 线 由 水 平 线 和 垂直 线 构成 。 每 条 水 平 线 都 可 通过 对 相应 开关 的 编程 与 几 条 垂直 线 连接 。 
提供 完全 连接 ， 即 每 条 水 平 线 可 与 任意 的 垂直 线 连 接 ， 是 不 可 行 的 ， 因 为 所 需 的 开关 数 会 很 大 。 
少量 的 开关 即 可 实现 满足 需求 的 连通 度 。 

市 场 上 的 CPLD 尺寸 不 同 ， 从 2 个 到 多 于 100 个 类 PAL 块 都 有 。 通 过 向 JTAG 端 口 加 载 编程 信息 
可 以 对 CPLD 芯片 编程 。 它 是 一 个 4 管 嘟 端口 ， 遵 循 由 联合 测试 工作 组 (Joint Test Action Group) 
制定 的 正 EE 标准 。 





图 A-45 复杂 可 编程 逻辑 器 件 (CPLD ) 的 结构 
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A.12 现场 可 编程 门 阵列 (FPGA) 


PAL 芯 片 提供 了 基本 的 功能 ， 但 是 在 尺寸 上 有 所 限制 ， 因 为 每 个 积 之 和 电路 都 需要 一 个 输出 
管 脚 。 为 此 开发 出 了 一 类 功能 更 强大 的 可 编程 器 件 来 克服 尺寸 的 局 限 。 这 就 是 现场 可 编程 门 阵 
列 《EPGA)。 图 A-46 给 出 了 FPGA 的 概念 框图 。 它 由 一 个 逻辑 块 阵列 (表示 为 较 大 的 黑 框 ) 组 成 ， 
这 些 人 逻辑 块 可 以 由 通用 互 连 资源 连接 。 互 连 开关 表示 为 较 小 的 方块 ， 由 导线 和 可 编程 开关 组 成 。 
这 些 开 关 用 来 连接 逻辑 块 和 导线 ， 以 及 在 不 同 导线 之 间 建 立 所 需 的 连接 。 这 给 予 了 芯片 很 大 的 
路 由 灵活 性 。 对 臣 片 管 财 的 访问 提供 了 输入 和 输出 缓冲 器 。 


N 
_ 
N 
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图 A-46 FPGA 的 概念 框图 


逻辑 块 和 互 连 结构 的 设计 是 多 种 多 样 的 。 逻 辑 块 可 能 只 是 A.10 季 中 简单 的 基于 多 路 复 用 器 的 
电路 ， 可 以 实现 逻辑 函数 。 另 一 种 流行 的 设计 是 将 简单 的 查找 表 作 为 逻辑 块 。 例 如 ， 一 个 4 输入 
查找 表 可 以 用 16 位 存储 电路 实现 ， 该 电路 储存 逻辑 函数 的 真 值 表 。 每 个 存储 位 与 一 个 输入 变量 
的 组 合 相 对 应 。 对 这 样 的 查找 表 编 程 可 以 实现 4 变量 的 任何 函数 。 罗 辑 块 可 能 会 包含 触发 器 ， 以 
提供 类 似 图 A-44 中 额外 的 灵活 性 。 

除了 四 辑 块 ， 许 多 FPGA 苑 片 还 包含 相当 数量 的 存储 单元 (图 A-46 中 没有 显示 )， 可 以 实现 ”13 
诸如 先进 先 出 FIFO) 队列 或 片上 系统 的 RAM 和 ROM 组 件 等 结构 ， 这 些 在 第 9 章 进行 了 讨论 。 

从 使 用 者 的 角度 来 看 ，FPGA 和 CPLD 有 两 个 主要 的 不 同 点 。FPGA 的 功能 更 为 强大 ， 可 以 用 
来 实现 相当 大 的 逻辑 网 络 。 一 块 FPGA 芯 片 可 以 实现 需要 超过 百 万 个 逻辑 门 的 电路 。 第 二 个 重要 
的 考虑 是 这 些 设备 的 速度 。 因 为 使 用 可 编程 开关 来 建立 互 连 中 的 所 有 连接 ， 与 灵活 性 较 小 的 器 
件 如 PAL 或 CPLD 相 比 ，FPGA 不 可 避免 地 具有 明显 的 传输 延迟 。 

FPGA 的 不 断 普 及 是 因为 它 允许 设计 者 在 一 块 芯片 上 实现 非常 复杂 的 逻辑 网 络 ， 而 无 需 设 计 
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制造 定制 的 VLSI 蕊 片 ， 这 些 艺 片 非常 昂贵 而 且 费 时 。 使 用 CAD 工 具 可 以 在 几 天 内 完成 FPGA 的 设 
计 ， 而 不 是 像 制造 定制 VLSI 芯 片 那样 需要 花费 几 个 月 的 时 间 。FPGA 实 现 的 成 本 也 很 吸引 人 。 即 
使 是 最 大 型 的 FFGA 也 仅仅 耗费 几 百 美元 ， 而 与 设计 时 间 相 关 的 成 本 和 设计 定制 芯片 相 比 是 非常 
小 的 。 

关于 可 编程 逻辑 器 件 的 介绍 性 讨论 可 以 在 许多 关于 逻辑 设计 的 书籍 中 找到 。 如 果 要 对 这 些 
器 件 有 更 多 的 了 解读 者 可 以 查阅 其 他 文献 [1、3~6] 和 制造 商 手册 。 


A.13 时 序 电 路 


组 合 电路 的 输出 完全 由 当前 的 输入 决定 。A.9 节 和 A.10 节 给 出 的 译 码 器 和 多 路 复 用 器 就 是 组 
合 电 路 的 例子 。 另 一 类 电路 的 输出 是 由 当前 的 输入 和 以 前 的 输入 序列 共同 决定 。 它 们 称 为 时 序 
电路 。 这 样 的 电路 可 以 处 于 不 同 的 状态 ， 这 些 状 态 由 在 给 定时 间 内 的 输入 序列 决定 。 电 路 的 状 
态 决 定 了 电路 在 不 同 输入 模式 下 的 行为 。 在 A.7 节 和 A.8 节 中 ,我 们 曾经 遇 到 这 种 电路 的 两 种 具体 
形式 : 移 位 寄存 器 和 计数 器 。 本 节 将 介绍 更 多 时 序 电 路 的 例子 ， 并 给 出 这 些 电 路 的 一 般 形式 和 
设计 这 类 电路 的 简短 介绍 。 


A.13.1 升值 / 降 值 计数 器 实例 


图 A-35 给 出 了 由 三 个 T 触 发 器 实现 的 开 值 计数 器 的 结构 ， 按 照 0, 1, 2, …, 7, 0, … 的 顺序 计数 。 
也 可 以 用 类 似 的 电路 实现 降 值 计数 ， 即 按 0, 7, 6, …, 1, 0, … 计 数 (见习 题 A.26)。 这 些 简单 的 电路 
都 利用 了 T 触 发 器 的 翻转 性 质 。 

下 面 考虑 一 下 使 用 D 触 发 器 实现 计数 器 的 可 能 性 。 作 为 一 个 具体 的 例子 ， 我 们 将 设计 一 个 既 
能 使 用 升值 计数 也 能 使 用 降 值 计数 的 计数 器 ， 升 值 或 降 值 由 一 个 外 部 控制 输入 的 值 决定 。 为 了 
使 这 个 例子 简单 一 点 ， 我 们 将 计数 器 限制 为 模 4 计数 器 ， 它 只 需要 两 个 状态 位 来 表示 四 个 可 能 的 
计数 值 。 下面 将 说 明 如 何 使 用 构造 时 序 电 路 的 基本 方法 来 设计 这 个 计数 器 。 所 需 电路 在 输入 信 
号 x 为 0 时 进行 升值 计数 ，x 为 1 时 进行 降 值 计 数 。 计 数 发 生 在 时 钟 信号 的 下 降 沿 。 假 设 我 们 对 计数 
为 2 时 的 状态 感 兴 趣 。 这 样 ， 输 出 信号 z 在 计数 为 2 时 为 1， 而 在 其 他 时 刻 都 为 0。 

所 需 的 计数 器 可 以 作为 时 序 电 路 实现 。 当 一 个 时 钟 脉冲 到 来 时 ， 为 了 确定 新 的 计数 ， 知 道 x 
的 值 和 当前 的 计数 值 就 够 了 。 我 们 无 需 知道 先前 输入 值 的 实际 顺序 ， 而 只 需 知道 当前 的 计数 值 。 
这 个 计数 值 决定 了 电路 的 当前 状态 ， 这 是 电路 保存 的 关于 先前 输入 的 惟一 信息 。 如 果 现在 的 计 
数 是 2 并 且 x =0， 下 一 个 计数 就 是 3。 从 3 降 值 计数 或 从 1 升值 计数 到 2 没有 任何 区 别 。 

在 给 出 电路 实现 之 前 ， 先 用 状态 图 描述 计数 器 所 需 的 行为 。 计 数 器 具有 4 个 不 同 的 状态 : S0, 
S1，S2 和 S53。 状 态 图 是 用 圆 图 (有 时 称 为 节点 ) 表示 状态 的 图 。 状 态 之 间 的 转换 用 带 标记 的 箭 
头 表示 。 与 箭头 对 应 的 标记 指示 了 会 使 特定 转换 发 生 的 输入 x 的 值 以 及 产生 输出 结果 的 值 。 图 
A-47 显 示 了 这 个 升值 / 降 值 计 数 器 的 状态 图 。 例 如 ， 从 状态 S1 (计数 值 = 1) 发 出 的 箭头 在 输入 
x = 0 时 指向 状态 S2， 这 样 指 示 了 向 状态 S2 的 转变。 它 还 表明 当 电 路 处 于 S1 状 态 且 x 的 值 为 O 时 输 
出 z 必 等 于 0。 从 52 到 53 的 箭头 表明 当 x = 0 时 ， 下 一 个 时 钟 脉冲 会 发 生 从 状态 S2 到 状态 S3 的 转变 ， 
并 且 在 电路 在 状态 S2 时 ， 输 出 z 必 是 1。 

注意 ， 状 态 图 描述 了 计数 器 的 功能 行为 ， 而 并 没有 提 及 它 如 何 实现 。 图 A-47 可 以 用 来 描述 
按 这 种 方式 表现 的 电子 数字 电路 、 机 械 计数 器 或 者 计算 机 程序 。 状 态 图 是 描述 具有 时 序 行为 的 
任何 系统 的 有 力 工 具 。 
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图 A-47 检测 计数 2 的 模 4 升值 / 降 值 计 数 器 状态 图 图 A-48 升值 / 降 值 计 数 器 例子 的 状态 表 


表示 状态 图 信息 的 另 一 种 方法 是 使 用 状态 表 。 图 A-48 给 出 了 图 A-47 例 子 的 状态 表 。 表 中 显 [35] 
示 了 在 输入 x 下， 从 所 有 当前 状态 到 下 一 状态 的 转换。 输出 信号 z 由 电路 的 当前 状态 和 输入 x 的 值 
决定 。 

我 们 已 经 描述 了 一 般 条 件 下 的 升值 / 降 值 计 数 器 ， 现 在 考虑 它 的 物理 实现 。 需 要 两 个 位 对 表 
示 计 数值 的 4 个 状态 进行 编码 。 令 这 两 个 位 为 yz (高 位 ) 和 yt (低位 )。 计 数 器 的 状态 由 请 和 y 的 
值 决 定 ， 我 们 将 它 写成 yy 的 形式 并 给 y,y! 赋值 为 ，S0 = 00，S1 = 01，S2 = 10 和 S3 = 11。 这 样 安 
排 使 得 二 进 制 数 yy 可 以 明显 地 表示 计数 值 。 变 量 y, y 称 为 时 序 电 路 的 状态 变量 。 使 用 这 一 状态 
分 配 ， 图 A-49 给 出 了 我 们 所 举例 子 的 状态 表 。 注 意 
使 用 变量 了 和 了 ;来 表示 下 一 状态 它们 的 用 法 与 1、 
yt. 

需要 注意 的 很 重要 的 一 点 是 ， 我 们 可 以 选择 另 
一 种 yy 对 不 同 状态 的 赋 什 方式。 例如， 可 能 后 值 
为 SO0 = 10，S1 = 11，S2 = 01，S3 = 00。 对 于 一 个 计 
数 器 电路 来 说 ， 这 种 赋值 方式 没有 图 A-49 直 观 ， 但 
是 结果 电路 仍然 会 运行 正常 。 通 常 ， 使 用 不 同 状态 
赋值 方式 实现 电路 的 成 本 也 不 相同 (见习 题 A.32)。 

我 们 举 这 个 例子 的 目的 是 使 用 D 触发 器 存储 连 
续 时 钟 脉冲 间 的 两 个 状态 变量 的 值 。 触 发 器 的 输出 图 A-49 图 A48 例 子 的 状态 分 配 
Q 是 当前 状态 变量 yy， 输 入 D 是 下 一 状态 变量 Y,。 注 意 7; Ey. yA x 的 函数 ， 如 图 A-49 所 示 。 从 图 
中 我 们 可 以 看 到 





Y= yx + yyixt y; y + yy 

= Oy Ox Tn 
Y, = y: yix +y Y x + Y+ Y x+ y Y ix 

= y, 


ON 


输出 z 由 式 子 
z = yo y, 
决定 。 这 些 表达 式 形成 了 图 A-50 所 显示 的 电路 。 
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图 A-50 升值 / 降 值 计数 器 的 实现 
A.13.2 时 序 图 


了 解 计 数 器 的 时 序 图 有 助 于 完全 掌握 计数 器 电路 的 操作 。 图 A-51 给 出 了 一 个 可 能 事件 序列 
的 例子 。 假 设 状态 转换 (改变 触发 器 的 值 ) 发 生 在 下 降 治 ,并且 计数 器 从 状态 SO 开始。 因为 x= 0， 
计数 器 在 时 刻 变 为 状态 S1，4 时 刻 变 为 S2，5 时 刻 变 为 S3。 当 计数 器 进入 状态 S2 时 ， 输 出 从 0 
变 到 1。 当 达到 状态 S3 时 又 变 到 0。 在 S3 状 态 末尾 的 时刻 ， 计 数 器 返回 S0 状 态 。 假 设 在 这 一 时 
刻 ， 输 入 x 变 为 1， 导 致 计数 器 降 值 计 数 。 当 计数 再 一 次 达到 S2 时 ， 即 在 5 时 刻 ， 输 出 z 变 为 1。 





状态 so SI S2 S3 So s3 S2 St so 


图 A-51 图 A-50 所 示 电 路 的 时 序 图 
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注意 所 有 信号 改变 都 在 时 钟 下 降 沿 之 后 立刻 发 生 ， 并 在 下 一 个 下 降 沿 到 来 之 前 不 会 发 生 改 
变 。 从 时 钟 边沿 到 变量 y 改变 之 间 的 延迟 是 实现 计数 器 电路 触发 器 的 传输 延迟 。 还 要 注意 我 们 假 
设 输入 x 也 由 同一 个 时 钟 控制 ， 并 且 它 的 转变 只 发 生 在 临近 时 钟 周期 开始 的 时 刻 。 这 是 所 有 改变 
均 由 一 个 时 钟 控 制 的 电路 的 基本 性 质 、 这 样 的 电路 称 作 同 步 时 序 电路 。 

另 一 个 关注 的 重点 是 图 A-47 中 状态 图 使 用 的 标记 与 时 序 图 的 关系 。 例 如 ， 考 虑 #1 与 之 间 的 
时 钟 周期 。 在 这 个 周期 内 ， 机 器 处 于 S2 状 态 且 输入 值 x = 0。 这 一 情况 在 状态 图 中 用 从 S2 状 态 发 
出 标号 为 x = 0 的 箭头 表示 。 因 为 这 个 箭头 指向 S3 状 态 ， 时 序 图 显示 在 下 一 时 钟 边沿 a， 关 和 y》 变 
为 S3 状 态 相 应 的 值 。 与 箭头 对 应 的 输出 值 在 S2 状 态 赋值 给 z。 


A.13.3 有 限 状态 机 模型 


图 A-50 中 使 用 触发 器 和 组 合 逻 辑 门 的 同步 时 序 电 路 实现 升值 / 降 值 计数 器 的 具体 例子 很 容易 
概括 为 图 A-52 中 的 标准 有 限 状态 机 模型 。 在 这 个 模型 中 ， 延 迟 元 件 的 时 间 延 迟 等 于 时 钟 周 期 的 
长 度 。 这 就 是 Y; 发 生变 化 到 相应 的 > 发 生变 化 的 时 间 。 模 型 假设 组 合 罗 辑 块 没有 延迟 ; 因此， 输 
iHz, Yi 和 六 是 输入 zx、 和》 的 瞬 态 函数 。 实 际 电 路 中 的 电路 元 件 会 产生 一 些 延 退 ， 如 图 A-51 所 
示 。 如 果 组 合 逻 辑 块 的 延迟 与 时 钟 周 期 相 比 很 小 ， 电 路 就 能 正常 工作 。 下 一 状态 的 输出 Y 必须 及 
时 使 触发 器 在 时 钟 周 期 未 尾 改 变 到 下 一 所 需 状 态 。 另 外 ， 虽 然 输出 z 可 能 在 整个 时 钟 周 期 内 都 没 
达到 要 求 值 ， 它 必须 在 这 个 周期 结束 之 前 达到 该 值 。 


输出 z 


下 一 状态 





延迟 元 件 
《触发 器 ) 
图 A-52 有 限 状态 机 的 标准 模型 


组 合 逻辑 块 的 输入 由 表示 当前 状态 的 触发 器 输出 y, 和 外 部 输入 x 组 成 。 块 的 输出 是 触发 器 输 
AY, 和 外 部 输出 z。 当 有 效 时 钟 边沿 到 来 结束 当前 时 钟 周期 时 ，Y; 线 的 值 被 写 和 触发 器 。 它 成 为 
状态 变量 ”的 下 一 组 值 。 因 为 这 些 信号 连接 在 组 合 块 的 输入 端 上 ， 所 以 它们 和 外 部 输入 x 将 产生 
新 的 z 和 Y; 值 。 一 个 时 钟 周期 过 去 之 后 ， 新 的 Y; 值 被 传送 给 y;， 如 此 反复 。 换 名 话说， 触发 器 形成 
了 组 合 块 从 输出 到 输入 的 反馈 回路 ， 并 引入 了 一 个 时 钟 周期 的 延迟 。 

尽管 图 A-52 只 显示 了 一 个 外 部 输入 ， 一 个 外 部 输出 和 两 个 状态 变量 ， 但 是 显而易见 ， 这 三 
种 变量 的 数目 都 是 可 以 变化 的 。 


~ 
` 





~J 
—_ 
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A.13.4 有 限 状 态 机 的 组 合 


让 我 们 总 结 一 下 如 何 根据 图 A-47 中 的 状态 图 设计 具有 图 A-52 基 本 结构 的 同步 时 序 电 路 。 设 
计 的 步 又 如 下 : 

1. 列 出 适当 的 状态 图 和 状态 表 。 

2. 确定 所 需 触 发 器 的 数目 ， 选 择 合适 类 型 的 触发 器 。 

3. 确定 状态 图 中 的 每 个 状态 需要 在 触发 器 中 存储 的 值 。 这 称 为 状态 分 配 。 

4. 列 出 状态 赋值 表 。 

5. 列 出 组 合 逻 辑 块 的 真 值 表 。 

6. 寻找 实现 组 合 逻 辑 块 的 适当 电路 。 

实例 

以 自动 售 货 机 作为 兼 具 输 入 和 输出 的 有 限 状态 机 的 例子 。 为 了 简单 起 见 ， 假 设 机 器 只 接受 
25 美 分 的 硬币 和 10 美 分 的 硬币 。 机 器 一 直接 受 这 两 种 硬币 直至 总 金额 达到 30 美 分 以 上 。 当 达到 
这 个 数目 时 ， 机 器 提供 一 个 输出 (商品 )。 即 使 金额 超过 30 美 分 也 不 找 零 。 用 二 进 制 输入 x1 和 x 
来 代表 投入 的 硬币 ,六 = 1 或 x2 = 1 分 别 代表 投入 了 一 个 25 美 分 或 一 个 10 美 分 硬币 。 除 此 之 外 ， 输 
入 均 为 0。 每 次 只 能 投入 一 枚 硬币 ， 因 此 输入 组 合 xi x, = 11 不 可 能 发 生 。 同 样 ， 用 二 进 制 输出 z 表 
示 机 器 提供 的 商品 ， 即 没有 商品 输出 时 z = 0， 而 有 商品 输出 时 z = 1。 

设计 售 货 机 电路 的 第 一 步 是 画 出 状态 图 或 状态 表 。 最 好 能 给 出 每 个 所 需 状态 的 口头 说 明 ， 
然后 再 决定 表示 这 些 状态 需要 多 少 触发 器 。 状 态 代表 投 币 过 程 中 任意 时 刻 的 总 金额 。 由 于 可 以 
按 任 何 顺序 投掷 25 美 分 硬币 和 10 美 分 硬币 直至 总 数 等 于 或 超过 30 美 分 ， 因 此 所 需 的 状态 为 : 

S0= 未 投 币 (“起 始 ” 状 态 ) 

S1 = 10 美 分 

S2 = 20 美 分 

S3 = 25 美 分 : 

我 们 不 需要 更 多 的 状态 ， 因 为 如 果 当 前 的 状态 是 S2 或 S3， 一 个 10 美 分 硬币 或 一 个 25 美 分 硬 
币 都 会 补足 当前 输入 ， 产 生 输 出 z = 1 并 将 状态 返回 到 S0 重 新 开始 。 

图 A-53 给 出 了 描述 自动 售 货 机 电路 所 需 行为 的 状态 图 。 注 意 输入 xi x = 1 的 情况 不 会 出 现 ， 
因为 不 可 能 同时 投掷 两 枚 硬币 。 还 要 注意 每 个 状态 都 有 一 个 标记 为 00/0 的 箭头 回 指 自己 。 这 表明 
如 果 在 一 个 时 钟 周期 内 没有 硬币 投入 ， 电 路 会 保持 它 的 当前 状态 。 

这 部 机 器 只 需要 4 个 状态 。 这 需要 两 个 触发 器 。 我 们 将 它们 标注 为 > 和 yy ， 并 且 为 各 状态 分 
配 的 值 为 $0 = 00，S1 = 01，S2 = 10，S3 = 11， 图 A-54 给 出 了 最 终 的 状态 分 配 表 。 在 表 中 使 用 短 
线 表 示 xixs = 1 的 输入 组 合 不 会 出 现 。 这 些 条 目 是 无 关 项 ， 在 设计 组 合 逻 辑 块 时 可 以 利用 ， 稍 后 
将 作 讨论 。 

这 就 完成 了 组 合 过 程 的 前 4 个 步骤 。 现 在 我 们 进行 第 5 步 。 图 A-54 中 的 状态 分 配 表 可 以 直接 得 
出 图 A-55 中 描述 组 合 逻 辑 块 功能 的 真 值 表 。 从 该 表 可 以 很 容易 地 得 出 下 面 实现 逻辑 块 的 表达 式 : 

Y; =X xy: + X> Yay! +X y2 9 
Yi=xixy + Ya y (mn + x) 
Z = y2(X1 + X2) + Xy 


注意 到 逻辑 项 xX1X2,， 7》 172 和 (Co ++) 在 不 止 一 个 表达 式 中 出 现 。 这 在 块 的 实现 中 会 降低 成 本 。 





ZHE — 2 in S — 





x =1 ~ 投入 25 美 分 硬币 
x,=1 ~ 投入 10 美 分 硬币 
Z=1 ~ 给 出 商品 

( 共 投 入 了 30 美 分 硬币 ) 
输入 组 合 *ixz2 = 11 不 可 能 发 生 


图 A-53 自动 售 货 机 例子 的 状态 表 


11 


00 722 
00 


00 





图 A-54 自动 售 货 机 例子 的 状态 分 配 表 


时 序 电 路 可 以 很 容易 地 用 PAL、CPLD 和 FPGA 实 现 ， 因 为 这 些 器 件 既 包括 触发 器 又 包括 组 合 
逻辑 门 。 现 代 的 计算 机 辅助 设计 工具 可 以 直接 根据 状态 图 的 描述 集成 时 序 电路 。 

注意 图 A-54 中 的 下 一 状态 和 输出 项 对 S2 和 5S3 在 状态 改变 发 生 时 的 所 有 输入 组 合 都 相同 。 这 
意味 着 并 不 真正 需要 两 个 状态 来 表示 总 金额 为 20 美 分 和 25 美 分 的 情况 。 只 要 一 个 状态 就 够 了 ， 
因为 无 论 当前 金额 是 其 中 的 哪 一 个 ， 只 要 再 投 一 枚 硬币 就 会 产生 商品 输出 (z = 1)， 并 使 机 器 返 
同 到 开始 状态 S0。 因 此 ， 状 态 S2 和 S3 是 等 价 的 ， 并 可 由 一 个 状态 代替 。 这 意味 着 实现 机 器 只 需 
三 个 状态 ， 但 仍然 需要 两 个 触发 器 。 而 在 更 一 般 的 情况 下 ， 由 状态 等 价 而 引起 的 状态 数目 的 减 
少 往往 会 使 触发 器 数目 减少 ， 电 路 也 会 更 简单 。 

实现 时 序 电 路 时 ， 在 所 需 的 组 合 罗 辑 中 可 以 进一步 节省 资源 。 不 同 的 状态 分 配 会 导致 不 同 
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的 逻辑 描述 ， 其 中 有 些 逻 辑 描 述 需 要 的 门 可 能 比 其 他 的 要 少 。 我 们 不 再 深入 研究 这 种 思想 ， 但 
读者 应 当 明 和 白 在 合理 设计 和 实现 时 序 电 路 的 过 程 中 ， 有 许多 有 
地 的 问题 月 要 考虑 。 

最 后 ， 应当 知道 状态 变量 也 可 以 用 其 他 类 型 的 触发 器 表示 。 0 ojo 
为 了 使 表示 尽量 简单 ， 在 这 里 使 用 了 D 和 触发 器 。 使 用 其 他 更 灵 
活 的 触发 器 ， 如 下 触发 器 ， 则 所 需 的 组 合 逻 辑 有 时 会 减少 。 可 
参见 习题 A.35 和 A.36 对 这 一 可 能 性 的 探讨 。 

前 面 所 介绍 的 时 序 电 路 都 是 在 同一 时 钟 的 控制 下 工作 。 
不 使 用 时 钟 也 可 以 实现 时 序 电 路 。 这 样 的 电路 称 为 异步 时 序 
电路 。 它 们 的 设计 不 像 同 步 时 序 电 路 这 样 直接 。 为 了 对 两 种 
时 序 电 路 有 完整 的 了 解 ， 可 以 参考 专门 介绍 逻辑 设计 的 书籍 tt 


3. TI 


A.14 结束 语 


本 附录 的 主要 目的 是 使 读者 了 解 逻 辑 设计 的 基本 概念 和 计 
算 机 体系 结构 中 普遍 使 用 的 电路 结构 。 熟 悉 了 这 些 知识 就 可 以 
更 好 地 掌握 在 本 书 主要 章节 中 介绍 的 体系 结构 概念 。 正 如 我 们 
多 次 提 到 的 ， 逻 辑 网 络 的 详细 设计 需要 借助 CAD 工 具 。 这 些 
工具 考虑 了 许多 细节 问题 ， 可 以 被 经 验 丰富 的 设计 人 员 有 效 地 
利用 。 

IC 技术 和 CAD 工 具 的 使 用 彻底 改革 了 逻辑 设计 。 市 场 上 图 A-55 自动 售 货 机 电路 
各 种 IC 组 件 的 成 本 不 断 降低 ， 而 且 新 的 发 现 和 技术 的 发 展 _- 的 组 合 多 辑 摘 述 
直 在 进行 。 这 个 附录 介绍 了 在 数字 系统 设计 中 有 用 的 一 些 基本 组 件 。 

从 设计 者 的 角度 来 看 ， 最 终 电路 的 成 本 和 速度 是 重要 的 参数 。IC 封 装 使 用 的 数量 越 少 ， 越 
能 提高 这 些 参数 。 使 用 大 型 的 芯片 ， 在 独立 的 芯片 上 实现 复杂 的 逻辑 网 络 ， 就 能 达到 这 -~ 目的. 
实际 上 ，、CPLD 和 FPGA 器 件 在 许多 应 用 中 都 提供 了 有 效 的 解决 方案 。 

另外 的 两 个 设计 目标 变 得 越 来 越 重要 。 结 果 电 路 的 易 测试 性 使 得 证 明 新 设备 运行 正常 和 当 
出 现 问题 时 的 修复 工作 变 得 更 加 容易 。 此 外 ， 经 常 需要 使 用 附加 的 、 宛 余 的 逻辑 电路 (例如 ， 
复制 一 些 部 分 ) 来 提高 系统 的 可 靠 性 。 这 些 可 能 会 提高 组 件 的 成 本 。 设 计 者 的 工作 就 是 在 这 些 
目标 中 找到 一 个 适当 的 平衡 点 。 许 多 书籍 1. 讨论 了 测试 和 容错 性 问题 。 


习题 
A.1 使 用 积 之 和 形式 实现 COINCIDENCE 函 数 ， 其 中 COINCIDENCE = XOR 。 
A.2 使 用 数学 公式 和 真 值 表 证 明 下 列 等 式 : 


(a) a@b@c = abc + abc + abc + abc 
(b) x+twxax+w 











a Aà Aà Q — =— =— Ọ = ~ O > °° O ° ° 


a a a Aà o OO O — o o O — me Q m 





a a a a o o Qo — oome O — — ° 


(c) x. X: + XX, +X, Xi = xx; + XX 
A.3 图 PA-1 给 出 了 4 个 3 变量 函数 及, 所, 记 , 记 的 最 小 积 之 和 形式 。 这 些 函数 还 有 其 他 形式 的 最 小 表 
达 式 吗 ? 如 果 有 ， 将 它们 都 写 出 来 。 
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0 
0 
0 
0 
1 
1 
l 
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= — << — — =° 
= —@ — —@ — —@ — ° 
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图 PA-1 习题 A.3 的 逻辑 函数 
A.4 利用 无 关 项 d 找 出 函数 的 最 简 积 之 和 形式 
f= xi Q2X3+ XX3 + X2 X3X4) + X2 X4 (X3 + X1) 
d= xi X:(X34+ X3X4) + X1 X3X4 
A.5 考虑 下 面 的 函数 
f OW xa) = D) + (aka + xaX) Xa +X X2 
(a) 使 用 卡 诺 图 找到 /的 最 小 成 本 积 之 和 (SOP) 表达 式 。 
(b) 找到 了 的 互补 项 的 SOP 表 达 式 ， 然 后 (使 用 德 摩根 律 》 对 这 个 SOP 表 达 式 取 反 ， 找 到 了 
的 表达 式 。 得 到 的 结果 表达 式 应 该 是 和 之 积 形式 (POS)。 将 它 与 (a) 中 所 得 的 SOP 表 达 式 的 
成 本 进行 比较 。 你 可 以 从 中 得 到 什么 结论 ? 
A6 GHKK f Gu, xx, xs, xa) 的 最 小 成 本 实现 ， 其 中 如 果 一 个 或 两 个 输入 逻辑 变量 是 1 时 ,f= 1, 
否则 f=0。 725 
A.7 图 A-6 定 义 了 一 个 4 位 BCD 码 数字 。 设 计 一 个 电路 ， 它 有 4 个 输入 ， 标 记 为 b3, …, bo 和 一 个 输 
出 f， 其 中 4 位 输入 模式 是 有 效 BCD 数 时 ,f= 1; 否则 f=0。 给 出 这 个 电路 的 最 小 成 本 实现 。 
A.8 两 个 2 位 数 4 = aa FIB = bo 要 由 4 变量 函数 f (a, as, bi, bo) 进行 比较 。 当 满足 
| v (A) < v (B) 
时 ， 函 数 的 值 为 !。 其 中 对 任意 2 位 数 ，v X) = xi x 21 + zx20。 假 设 变量 4 和 B 满 足 v(4) - 
WB)I<2。 以 最 少 的 门 实现 f。 
A9 重复 习题 A.8， 要 求 当 v (4) >v(B) 有 时， 函数 f= 1; 其 输入 满足 v (4) +v (B)<4。 
A10 证 明 结合 率 对 与 非 操作 符 不 适用 。 
A.11 使 用 与 非 门 (不 超过 6 个 ) 实现 下 面 函 数 ， 每 个 门 有 三 个 输入 。 假 设 原 值 和 反 值 都 可 用 。 
f= xiX2 + XIX2X3 T X 1 X2 X3 X4 F X1 X2X3 X4 
A.12 使 用 6 个 或 更 少 的 与 非 门 实现 下 面 函 数 。 不 能 使 用 反 输 入 变量 。 
了 = xp +x3+xXIx4 
A.13 只 使 用 与 非 门 ， 尽 可 能 经 济 地 实现 下 面 函 数 。 不 允许 有 反 输 入 变量 。 
f= tx) (Z+ x) ` 


A.14 使 用 二 进 制 表示 的 连续 数字 间 只 有 i 位 不 同 的 数字 码 称 为 Gray 码 。3 位 Gray 码 和 二 进 制 码 变 
换 的 真 值 表 如 图 PA-2a。 
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(a) 只 使 用 与 非 门 实现 函数 fi, f; fs. 
(b) 注意 到 下 列 输入 和 输出 变量 的 关系 ， 可 以 使 这 一 码 制 转换 的 网 络 成 本 更 低 。 
fi=a 
hp=f®b 
p=fh@e 
使 用 这 些 关 系 ， 指 明 可 重复 的 组 合 网 络 N 的 内 容 ， 从 而 实现 转换 ， 如 图 PA-2b 所 示 。 比 较 
这 种 形式 下 实现 转换 所 需 的 与 非 门 数量 与 3 部 分 中 的 与 非 门 总 数 。 





3 位 Gray 码 输入 | 二 进 制 码 输出 








a) 3 位 Gray 码 到 二 进 制 码 的 转换 


= m e = OOOO a 
O — — O0 Om.. ° izi 
= — — — OD O ° ° 





= —< O O — — 0 ° 
== @ — @ — Ç — ° 


b) 码 制 转换 网 络 





图 PA-2 习题 A.14Gray 码 转换 的 例子 
A.15 使 用 4 个 2 输入 与 非 门 实现 异 或 函数 。 
A.16 图 A-37 定 义 了 一 个 BCD 码 七 段 显示 器 译 码 器 。 使 用 与 、 或 、 非 门 给 出 该 真 值 表 的 实现 。 证 
明 图 中 的 与 非 门 电路 实现 了 同样 的 功能 。 
A17 在 图 PA-3 的 逻辑 网 络 中 ， 门 3 坏 了 ， 不 管 输入 为 何 值 ， 其 输出 Fi 都 产生 逻辑 值 1。 重 新 画 出 


727 网 络 图 ， 尽 可 能 化 简 ， 用 最 少 的 门 得 出 一 个 与 所 给 有 故障 网 络 等 价 的 新 网 络 。 假 设 错误 出 
在 F2， 它 被 所 锁定 在 逻辑 9， 重 复 此 问题 。 





图 PA-3 一 个 有 故障 的 网 络 
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A.18 


A.19 


A.20 


A.2 
A.22 
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A.23 


A.24 


A.25 
A.26 


图 A-16 显 示 了 普通 CMOS 电 路 结构 。 设 计 一 个 CMOS 电 路 实现 下 列 函 数 。 
fey, X4) = XIX2 + XI3X4 
尽 可 能 少 用 晶体 管 。( 提 示 : 考虑 晶体 管 的 串联 /并 联网 络 。 注 意图 A-17 和 图 A-18 中 上 拉 和 
下 拉 网 络 相 反 的 串联 和 并 联结 构 。) 
画 出 图 A-31 中 反 电 路 输出 Q 的 波形 ， 利 用 图 PA-4 的 输入 波形 并 假设 触发 器 开始 处 于 0 状态 。 





图 PA-4 下 触 发 器 的 输入 波形 


写 出 图 PA-5 中 与 非 门 电路 的 真 值 表 。 将 其 与 图 A-24b 中 的 真 值 表 比 较 ， 然 后 证 明 图 A-26 中 
的 电路 与 图 A-25a 中 的 电路 等 价 。 


A 


Qi 


图 PA-5 与 非 锁 存 器 


以 或 非 门 的 延迟 为 单位 ， 计 算 图 A-29 中 下 降 沿 触发 的 D 触 发 器 的 建立 时 间 和 保持 时 间 。 

在 图 A-27a 的 电路 中 ， 用 或 非 门 代替 所 有 的 与 非 门 。 写 出 结果 电路 的 真 值 表 。 这 个 电路 与 
图 A-27a 中 的 电路 有 何不 同 ? 

图 A-33 显 示 了 一 个 在 时 钟 信号 控制 下 每 次 将 数据 右 移 一 位 的 移 位 寄存 器 网 络 。 改 进 这 个 移 
位 寄存 器 ， 使 它 能 够 在 时 钟 和 附加 控制 输入 ONEATWO 的 共同 作用 下 每 次 移动 数据 的 一 位 
或 两 位 。 

我 们 需要 一 个 4 位 移 位 寄存 器 ， 它 有 两 个 控制 输入 端 -一 INITIALIZE 和 RIGHT/LEFT, 4 
INITIALIZE 置 为 1 时 ， 二 进 制 数 1000 被 写 人 寄存器， 而 与 时 钟 输入 无 关 。 当 INITIALIZE = 
0 时 ， 时 钟 输入 的 脉冲 将 这 个 模式 循环 移 位 。 当 RIGHTILEFT 的 输入 等 于 1 或 0 时 ， 模 式 分 别 
循环 右 移 或 循环 左 移 。 使 用 图 A-32 中 具有 预 置 和 请 除 输入 的 D 触 发 器 ， 给 出 这 个 寄存 器 的 
合理 设计 。 

构造 一 个 3 输入 8 输出 的 译 码 器 网 络 ， 规 定 所 使 用 的 门 输入 不 得 超过 2 个 。 

图 A-35 显 示 了 一 个 3 位 升值 计数 器 。 按 相反 顺序 ( 即 7, 6, …, 1, 0, 7, …) 计数 的 计数 器 称 为 
降 值 计数 器 。 能 在 UPIDOWN 信 号 控制 下 按 两 种 顺序 计数 的 计数 器 叫做 升值 / 降 值 计数 器 。 
画 出 一 个 3 位 升值 / 降 值 计 数 器 的 逻辑 图 ， 它 能 从 外 部 源 并 行 加 载 触发 器 ， 从 而 可 以 被 预 置 
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A.27 


A.28 


A.29 


A.30 


A.3 


m 


A.32 


A.33 


A.34 


A.35 


A.36 
A.37 


为 任何 状态 。LOAD/COUNT 控 制 用 来 决定 计数 器 是 被 加 载 还 是 做 计数 操作 。 
图 A-35 显 示 了 一 个 异步 3 位 升值 计数 器 。 设 计 一 个 4 位 同步 升值 计数 器 ， 按 0, 1, 2,…, 15, 0,… 
的 顺序 计数 。 在 电路 中 使 用 T 触 发 器 。 在 同步 计数 器 中 ， 所 有 的 触发 器 都 能 同时 改变 它们 
的 状态 。 因 此 ， 主 时 钟 输入 应 直接 与 所 有 触发 器 的 时 钟 输入 相连 。 
实现 如 下 表达 式 摘 述 的 开关 国 数 
f (Xu, X2, X3, Xa) = XIXa X4 + X 1 X3X4 T X2X3X4 
(a) EMISIA £ k 5 Fl as rB ps Sk gl f. 
(b) 可 以 用 4 输入 多 路 复 用 器 实现 f 吗 ? 如 果 可 以 ， 请 写 出 方法 。 
当 
f G, X2, X3, X4) = X1 X2X3 + X2X3X4 HXI Xa 
重复 习题 A.28。 
(a) 3 个 二 进 制 变量 的 函数 Fe xz, x3)， 其 总 数 有 多 少 ? 
(b) 这 些 函 数 中 有 多 少 可 以 用 图 A-43 中 的 PAL 电 路 实现 ? 
(c) 如 果 任 何 3 变 量 针 数 都 能 用 一 个 PAL 电 路 实现 ， 那 么 对 图 A-43 中 电路 做 的 最 小 改动 是 什 
么 ? 
考虑 图 A-43 中 的 PAL 电 路 。 假 设 电 路 增加 了 第 4 个 输入 变量 x+*， 其 正 向 和 反 向 形式 可 以 和 变 
量 xi, x%,% 一 样 连接 到 所 有 4 个 与 门 。 
(a) 这 个 修改 过 的 PAL 可 以 实现 下 面 的 函数 吗 ? 如 果 可 以 请 写 出 方法 。 
f= xi X:X3+ XXX3+ X1X2G 
(b) 多 少 个 3 变量 的 函数 不 能 用 这 个 PAL 实 现 ? 
使 用 状态 分 配 S0 = 10, S1=11, S2=01, S3 = 00 完 成 对 图 A-47 中 升值 / 降 值 计数 器 的 设计 。 
这 个 设计 与 A.13.1 节 的 有 什么 不 同 ? 
使 用 D 触 发 器 设计 一 个 如 图 A-50 中 基本 形式 的 2 位 同步 计数 器 ， 按 照 …0, 3, 1, 2, 0, … 的 顺序 
计数 。 这 个 电路 没有 外 部 输入 ， 输 出 是 触发 器 自己 的 值 。 
重复 习题 A.33， 设 计 一 个 按照 …0, 1, 2, 3, 4, 5, 0, … 计 数 的 三 位 计数 器 。 设 计 组 合 逻 辑 时 ， 
将 未 使 用 的 计数 值 6，7 作 为 无 关 项 。 
A.13 节 使 用 D 触 发 器 设计 同步 时 序 电 路 。 这 是 最 简单 的 选择 ， 因 为 D 输 入 的 逻辑 函数 值 直 


接 由 状态 表 中 所 需 的 下 一 状态 值 决定 。 假 设 用 下 触发 器 代替 D 触 发 器 。 建 立 一 个 表格 ， 描 


述 如 何 将 触发 器 J 和 K 输 入 端的 二 进 制 值 确定 为 该 触发 器 每 个 可 能 的 从 当前 状态 到 下 一 状态 
迁移 的 函数 。( 提 示 : 表 应 该 有 4 行 ， 每 个 迁移 0~0, 0~1, 1~0, 1~ 1 一 行 ; 并 且 每 个 J 和 K 
项 是 0，! 或 无 关 项 。) 应 用 该 表 的 信息 为 习题 A.33 中 2 位 二 进 制 计数 器 的 两 个 触发 器 的 J 和 K 
输入 进行 设计 。 这 里 所 需 的 逻辑 简化 与 使 用 D 触 发 器 进行 的 计数 器 设计 有 什么 不 同 ? 

使 用 开 触 发 器 代替 D 触发 器 重复 习题 A.34。 实 现 的 步骤 已 经 在 习题 A.35 中 给 出 。 

在 A.13.4 节 说 明 有 限 状 态 机 器 模型 的 自动 售 货 机 例子 中 ， 使 用 了 一 个 二 进 制 输出 z 表 示 货 
物 的 输出 。 找 零 不 作为 输出 。 本 习题 的 目的 是 扩展 输出 ， 使 其 包括 适当 的 投 零 。 假 设 10 美 
分 和 25 美 分 的 输入 序列 仅 有 10-10-10, 10-25, 25-10 和 25-25。 与 最 后 一 个 输入 的 硬币 相对 应 ， 
需要 为 这 些 序列 提供 的 输出 值 分 别 是 0, 5, 5 和 20。 使 用 两 个 新 的 二 进 制 输 出 z; 和 z; 代表 这 
三 个 不 同 的 输出 。( 这 并 不 直接 与 使 用 的 硬币 对 应 ， 但 是 问题 会 变 得 容易 。) 

(a) 描述 包含 新 输出 的 状态 表 。 





E # eK 


(b) 写 出 新 输出 2 和 zs 的 逻辑 表达 式 。 
(c) 在 新 的 状态 表 中 存在 等 价 状态 吗 ? 
A.38 有 限 状 态 机 可 以 用 来 检测 输入 到 机 器 的 二 进 制 序列 中 某 些 子 序列 的 发 生 情 况 。 这 样 的 机 器 
称 为 有 限 状态 识别 器 。 假 设 不 论 何 时 输入 序列 中 出 现 模式 011， 则 机 器 在 接收 该 模式 的 第 
二 个 1 时 在 其 输出 产生 1。 
(a) 画 出 这 台 机 器 的 状态 图 。 
(b) 假设 使 用 D 触 发 器 ， 为 所 需 数 且 的 触发 器 进行 状态 分 配 并 构造 分 配 状 态 表 。 
(c) 写 出 输出 变量 和 下 一 状态 变量 的 逻辑 表达 式 。 
A.39 机 器 在 输入 序列 中 识别 子 序 列 011 和 010， 包 括 重 又 出 现 的 情况 。 重 复习 题 A.38 的 a 部 分 。 
例如 ， 当 输入 序列 是 110101011… 时 产生 的 输出 序列 是 000010101…。 


参考 文献 


1. 


S. Brown and Z. Vranesic, Fundamentals of Digital Logic with VHDL Design, 
McGraw-Hill, Burr Ridge, IL, 2000. 


. A.S. Sedra and K.C. Smith, Microelectronic Circuits, 4th ed., Oxford, New York, 


1998. ` 


. J.F. Wakerley, Digital Design Principles and Practices, Prentice Hall, Upper Saddle 


River, NJ, 2000. 


. J.H. Jenkins, Designing with FPGAs and CPLDs, Prentice-Hall, Englewood Cliffs, 


N.J., 1994. 


, S.M. Trimberger, Field-Programmable Gate Array Technology, Kluwer, Boston, 


1994. 


. S.D. Brown, R.J. Francis, J. Rose, and Z.G. Vranesic, Field-Programmable Gate 


Arrays, Kluwer, Boston, 1992. 


. R.H. Katz, Contemporary Logic Design, Benjamin Cummings, Redwood City, 


Calif., 1994. 


- J.P. Hayes, Digital Logic Design, Addison-Wesley, Reading, Mass., 1993. 
. F.H. Hill and G.R. Peterson, Computer Aided Logical Design with Emphasis on 


VLSI, 4th ed., Wiley, New York, 1993. 


. C.H. Roth, Fundamentals of Logic Design, 4th ed., West, St. Paul, Minn., 1992. 
. M.M. Mano and C.R. Kime, Logic and Computer Design Fundamentals, Prentice- 


Hall, Upper Saddle River, N.J., 1997. 


. M. Abramovici, M.A. Breuer, and A.D. Friedman, Digital Systems Testing and 


Testable Design, revised edition, IEEE Press, New York, 1995. 


. V.N. Yarmolik, Fault Diagnosis of Digital Circuits, Wiley, Chichester, England, 


1994. 


P.K. Lala, Digital System Design Usihg Programmable Logic Devices, Prentice- 
Hall, Englewood Cliffs, N.J., 1990. 


. B.W. Johnson, Design and Analysis of Fault-Tolerant Digital Systems, Addison- 


Wesley, Reading, Mass., 1989. 


. A.J. Miczo, Digital Logic Testing and Simulation, Wiley, New York, 1986. 
. D.K. Pradhan, Fault-Tolerant Computing, Prentice-Hall, Englewood Cliffs, N.J., 


1986. 


517 


731 
l 





MRB 
ARM 指 令 集 


我 们 在 第 3 章 第 一 部 分 中 描述 了 v3 版 本 ARM 指 令 集 体系 (ISA)， 这 里 对 其 进行 概要 描述 ， 同 
时 对 ISA 的 后 续 版 本 所 作 的 改进 进行 简要 的 讨论 。ARM 寄 存 器 结构 如 图 3-1 所 示 。 指 令 集 命令 的 
一 般 格式 在 图 3-2 中 给 出 。 这 里 ， 我 们 将 给 出 不 同类 型 指令 的 详细 内 容 。 在 ARM 指 令 集中 ， 所 有 
的 指令 都 被 编码 成 32 位 的 字 。 内 存 可 以 按 字 节 寻 址 并 且 其 地 址 长 度 是 32 位 的 。 操 作 数 大 小 有 两 
种 : 字 (32 位 ) 和 字 节 (8 位 )。 单 字 节 操作 数 使 用 处 理 器 寄存 器 的 低 8 位 。 当 一 个 单字 节操 作 数 
被 装 入 到 一 个 寄存 器 时 ， 其 高 位 部 分 的 三 个 字 节 都 清 成 零 。 


B.1 指令 编码 


图 B-1 给 出 了 5 种 指令 的 编码 情况 。 不 同 指令 的 类 型 是 根据 起 始 于 bz; 的 位 模式 来 说 明 。 图 B-1b 
的 乘法 指令 与 B-la 中 其 他 算术 和 逻辑 指令 组 有 所 不 同 。 在 后 一 组 中 ， 当 I = 0 时 ,或 bs 位 中 有 一 
个 为 0， 但 在 乘法 指令 中 这 些 位 都 是 1。 注 意 Rn 和 Rd 字段 在 乘法 指令 中 位 置 是 颠倒 的 。 

后 面 的 几 节 给 出 了 5 种 类 型 指令 的 编码 细节 以 及 相应 的 范例 。 完 整 的 ARM 体 系 结构 具有 与 协 
处 理 器 操作 相关 的 附加 指令 。 对 此 我 们 给 出 简要 讨论 。 

条 件 执行 指令 

表 B-1 中 列 出 了 条 件 执行 指令 的 条 件 。 所 期 望 的 条 件 以 后 组 的 形式 添加 到 指令 OP GRE) 码 
的 助 记 符 中 。AL 条 件 表明 指令 的 执行 不 考虑 条 件 码 标志 的 状态 。 汇 编 语言 程序 中 ， 默 认 状 态 是 
DESER. fån, ADD (Add) 和 B (Branch) 总 是 会 被 执行 的 ， 但 是 ADDEQ 和 BEQ 只 有 Z = 1 
的 时 候 才 能 执行 。 条 件 指令 经 常 与 一 个 比较 指令 一 同 使 用 。 在 表 B-1 的 名 称 一 栏 给 出 了 它 的 使 用 
方式 。 

B.1.1 算术 和 逻辑 指令 


算术 和 逻辑 指令 与 比较 、 检 测 和 传送 操作 一 样 ， 也 是 采用 图 B-2 中 的 指令 格式 。 第 一 个 操作 
数 在 寄存 器 Rn 中。 第 二 个 操作 数 或 者 是 在 寄存 器 Rm 中 ， 或 者 是 一 个 无 符号 的 8 位 立即 操作 数 
(由 第 I 位 表明 )。 由 4 位 OP 码 指定 要 进行 的 操作 ， 操 作 的 结果 保存 在 寄存 器 Rd 中 。 如 果 S 位 等 干 1， 
说 明 条 件 码 标志 受 结果 影响 ， 反 之 (S=0) 条 件 码 标志 不 受 结果 的 影响 。 
这 一 类 指令 的 一 般 汇编 语言 形式 是 
OP{Cond} {S} Rd, Rn, Operand 2 
例如 ， 如 果 第 二 个 操作 数 存储 在 一 个 寄存 器 中 (0), EF 
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ADD RO,RI,R2 
被 无 条 件 的 执行 ， 进 行 操作 
RO [RI] + [R2] 
而 不 影响 条 件 码 标志 。 如 果 OP 码 换 成 是 ADDS， 那 么 操作 的 结果 会 影响 到 条 件 码 标志 。 如 果 后 
续 的 指令 是 条 件 执 行 的 ， 假 定 条 件 是 相等 EQ)， 则 OP 码 将 写作 ADDEQS.。 
如 果 第 二 个 操作 数 是 一 个 立即 值 (=1)， 用 “# 常 数 ” 表 示 。 例 如 ， 
ADD R0, RI, #17 
进行 操作 
R0-[R1]+ 17 
在 使 用 该 操作 数 之 前 ， 立 即 数 的 值 要 用 0 扩展 到 32 位 。 


31 28 27 24 16 15 12 11 0 


e peeh s|] e | 


DAR Wi. Hik. MRR 


= | ooroo Ja 16 15 12 11 


x | o o o o o ofals u| m| w Toole] 


b) 乘法 和 乘法 累加 指令 


31 28 27 19 16 15 12 11 0 
mp s 1 
c) 从 /向 存储 器 传送 单字 或 字 节 指 令 


31 28 27 


0 
735 
ee r 


d) 从 /向 存储 器 传送 多 字 指 令 


31 28 27 0 


El aa 


e) 传送 指令 和 带 有 连接 的 传送 指令 


I 立即 数 P 预 /传递 变 址 W 写 回 
S w U 升值 / 降 值 L BAM 
A 累加 B 字 节 / 字 K 连接 


图 B-1 ARM 指 令 编 码 格式 
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表 B-1 ARM 指 令 条 件 字段 编码 


REFR ba bos 条 件 后 缀 名 R 条 件 码 测试 
0 0 0 0 EQ 相等 (0) Z=1 
0 0 0 1 NE 不 等 ( 非 0) Z=0 
0 0 1 0 CS/HS 进位 置 位 /无 符号 大 于 或 等 于 C=1 
0 0 1 1 CC/LO 进位 清除 /无 符号 小 于 C=0 
0 1 0 O MI ak (负数 ) N=1 
0 10 1 PL Jü ( 正 数 或 零 ) N=0 
0 1 1 0 VS 溢出 V=1 
0 1 1 l VC 不 溢出 V=0 
1 0 0 O HI 无 符号 大 干 CvZ=0 
1 0 O 1 LS 无 符号 小 于 或 等 于 CvZ=1 
1 0 1 O GE 有 符号 大 于 或 等 于 N@V=0 
1 0 1 1 LT 有 符号 小 于 NBV=1! 
1 1 0 0 GT 有 符号 大 于 Zv(N@V)= 0 
l 1 0 1 LE 有 符号 小 二 或 等 于 Zv(N@V)=1 
1 1 1 O AL 一 直 有 效 
1 1 1 1 不 使 用 








31 19 16 15 12 11 0 


28 24 21 
= s=] = | 
| 736 
目的 寄存 器 
操作 数 1 寄存 器 


置 位 条 件 码 标志 
0: 不 变换 标志 
L 置 位 标志 


11 4 3 0 
0 


Operand 2 = #£f [Rm] 


l 8 D 


Operand 2 = 循环 立即 数 
图 B-2 ARM 算术、 逻辑、 比较 、 测 试 和 传送 指令 
第 二 个 操作 数 的 移 位 
"如果 第 二 个 操作 数 保存 在 一 个 寄存 器 (I = 0) 中 ， 那 么 它 可 以 在 使 用 前 进行 移 位 ， 如 图 B-3 
所 示 。 移 位 体现 在 第 bu -4 位 上 。 如 果 = 0， 在 第 -7 位 上 用 一 个 5 位 无 符号 数 来 表示 一 个 
从 0 到 31 的 移动 量 。 在 bs 和 bs 位 中 指明 移 位 的 类 型 。4 种 移 位 操作 中 所 涉及 的 条 件 码 标志 C 如 
图 2-30 和 图 2-32 中 所 示 。 当 移 位 的 位 数 不 为 0 时 ， 循 环 右 移 的 操作 (ROR) 不 需要 C 位 (jJ 
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位 )。 但 是 ， 当 移 位 的 位 数 是 0 时 ， 则 表示 : 带 有 【进位 ) C 位 的 循环 右 移 一 位 ， 如 图 2-32d 


所 示 。 该 操作 可 以 使 用 汇编 语言 中 的 助 记 符 RRX (扩展 
的 循环 右 移 ) 来 表示 ， 其 中 不 指定 移动 位 数 。 正 如 上 面 
描述 的 那样 ， 当 在 指令 中 直接 指定 移动 的 位 数 时 ， 指 令 
语法 的 形式 可 写成 

ADD RO, R1, R2, LSL #4 
执行 的 操作 是 将 保存 在 R2 的 操作 数 向 左 移 了 4 位 (相当 于 乘 
以 16)， 然 后 与 R1 中 的 内 容 相 加 。 如 果 bs = 1， 移 动 的 位 数 由 
寄存 器 Rs 的 低 5 位 指明 ， 如 图 B-3 所 示 。 例 如 ， 指 令 

ADD RO, R1, R2, LSR R3 
将 R2 中 内 容 向 右 移 动 ， 移 动 的 位 数 由 R3 中 的 内 容 指 定 。 

“如 果 第 二 个 操作 数 是 一 个 立即 数 (I = 1) ,那么 它 将 按 
照 图 B-2 所 示 向 右 移 。 这 选项 通过 对 一 个 无 符号 的 8 位 
立即 数 进行 循环 右 移 来 生成 一 个 32 位 的 大 数 。 移 动 的 
位 数 是 22， 其 中 "是 -s 中 给 出 的 4 位 数 。 因 此 ， 循 环 
的 范围 是 从 0 到 30 的 偶数 位 。ARM 指 令 集 的 这 一 特性 从 
某 种 程度 上 补偿 了 指令 中 32 位 立即 操作 数 的 不 足 。 但 
是 ， 很 明显 ， 并 非 所 有 的 值 都 能 通过 这 种 方法 产生 。 


11 S43 0 


移 位 Rm 





11 765 


11 


8 ， : 


L 

00 LSL 逻辑 左 移 
0 1 LSR 逻辑 右 移 
1 0 ASR 算术 右 移 
ll ROR 循环 右 移 


图 B-3 对 第 二 个 操作 数 (图 B-2) 或 
寄存 器 Rm 中 的 地 址 偏 移 量 
(图 B-5) 进行 ARM 移 位 操作 


不 过 可 以 利用 短 序列 指令 ,包括 循环 操作 和 OR 操作 ， 来 合成 一 个 32 位 的 数值 ， 这 个 值 是 


无 法 由 一 个 单独 的 8 位 值 经 过 循环 操作 而 得 到 的 。 


表 B-2 和 表 B-3 给 出 了 完整 的 16 位 算术 和 逻辑 指令 集 ， 以 及 将 要 在 下 一 小 节 中 讨论 的 两 个 乘 
法 指令 。 该 组 指令 中 有 6 个 关于 加 减 的 指令 。 其 中 进位 加 法 和 进位 减法 指令 是 用 来 对 多 字 操 作 数 
进行 操作 的 。 因 为 只 有 第 二 个 操作 数 可 以 被 移 位 ， 所 以 提供 了 两 个 反 向 减法 指令 使 得 在 减法 操 


作 中， 被 移 位 的 操作 数 作为 第 一 个 操作 数 来 使 用 。 


在 一 个 加 法 或 减法 指令 中 ， 如 果 一 个 立即 值 被 当 作 第 二 操作 数 使 用 ， 那 么 它 只 能 是 一 个 正 


值 。 但 是 汇编 语言 允许 使 用 指令 

ADD RO, R1,# -5 
和 

SUB R0, R1,# 一 7 
并 把 它们 分 别 汇编 成 


SUB RO, R1, #5 
和 


` ADD RO, R1, #7 


除了 4 种 逻辑 指令 ，AND、ORR、EOR、BIC 及 传送 补 码 指令 (MVN) 执行 了 逻辑 非 (NOT) 


操作 。 比 较 和 测试 指令 通常 会 影响 条 件 码 标志 。 
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两 条 传送 指令 用 来 将 第 二 操作 数 或 它 的 按 位 补 码 传递 给 目的 寄存 器 。 第 二 操作 数 可 以 保 
存在 寄存 器 中 或 者 是 一 个 立即 操作 数 。 因 此 ， 这 两 条 指令 除了 可 以 进行 寄存 器 传送 操作 以 外 ， 
还 可 以 将 常数 写 人 寄存 器 中 。 而 MVN 指 令 还 可 以 装 和 人 一 个 用 补 码 形式 表示 的 负数 。 例 如 ， 指 
令 

MOV R0,# -10 
被 汇编 为 
MVN RO, #9 
因为 9 = 0…01001 ， 其 补 码 是 1…10110， 即 是 - 10 的 补 码 表示 。 


表 B-2 ARM 算 术 指令 





助 记 符 名称) 操作 码 执行 的 操作 ”如 果 S=1 受 影响 
u ”的 CC 标志 


ba bn | N Z v C 


ADD 0100 :Rd [Rn]+ Oper2 iX X X X 
ADC 0101  Ra- [Rn]+ Oper2 + [C] x Xx x x 


SUB 0010 Rd- [Rn] ~ Oper2 XK X X x 
( 减 ) 


SBC 0110 (Rd [Rn] - Oper? + [C] -1 x x x x 
( 带 进位 减 ) | | 


RSB 0011 | Rd ~ Oper2 — [Rn] X X ix x 
( 反 向 减 ) : f 

RSC 0111 ‘Rd Oper2 —[Rn]+ [C] -1 x x x x 
( 带 进位 的 反 向 减 ) u u 

MUL | Rd ~ [Rm] x [Rs] x x 


Jl : 
($) (参见 图 B-4) 


MLA Rd = [Rm] x [Rs]+ [Rn] x x 
m 
(RMR) (BEBA) 





羔 法 指令 


图 B-4 和 表 B-2 分 别 给 出 了 两 条 乘法 指令 的 格式 及 操作 。 乘 法 指令 中 的 任何 一 个 操作 数 都 不 
可 以 进行 移 位 操作 。 产 生 的 乘积 是 一 个 单 精 度 的 32 位 值 。 
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表 B-3 ARM 逻辑、 比较 、 测 试 和 传送 指令 


助 记 符 (名称) x 操作 码 执行 的 操作 ”如 果 S = 1 受 影响 
f : 的 CC 标志 


AND 0000 Rd- [Rn]^ Oper? x 
(24815) | | : 





ORR 1100 Ra-[Rn] VOpe2 | 
GEHA) x x 





EOR 0001 Rd [Refppe2 x x x 





BIC 1110 Rd [Rn]A—Ope2 x x x 
(位 清除 ) x x x 





CMP x 1010 [Rn] -Oper2 ix x x Xx 
(比较 ) x x À 





CMN 1011 [Rn]+ Oper2 X x X x 
(比较 负数 ) : f Í `: | 





TST 1.000 ` Rn]A Oper2 x x x 
(位 测试) x * x 


TEQ 1001 | ERnlempemz x x x 
(测试 相等 ) BEL 


MOV 1101 Rd- Oper X X x 
(传送 ) | i f 


MVN 1111 Rd- -Oper | P 
( 补 码 传送 ) x : 1 





31 15 12 11 8 


28 19 16 7 4 3 0 
| 牌位 条 件 码 标志 


0: 不 改变 标志 

L 置 位 标志 

累加 标记 

0: Æ (MUL) 
MUL: Rd — [Rm] x [Rs] 1: RmÆ (MLA) 
MLA: Rd —R [Rm] x [Rs] + [Rn] 


图 B-4 ARM 乘 法 和 乘法 累加 指令 
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B.1.2 内 存 加 载 和 存储 指令 


图 B-5 给 出 了 访问 内 存 的 两 条 指令 格式 ， 表 B-4 则 给 出 了 它们 相应 的 操作 。 在 加 载 (LDR ) 
指令 中 第 L 位 (bx) 是 1 而 在 存储 (STR) 指令 中 是 0 。 在 字 节 操作 数 中 第 B 位 (bs) 是 1 而 在 32 
位 字 操 作 数 中 是 0。 一 个 字 节 的 操作 数 通 常 保存 在 Ra 的 低位 字 节 中 。 内 存 操作 数 的 有 效 地 址 由 寄 
FER, 内 容 中 的 偏 移 量 字段 指定 的 偏 移 量 来 决定 ,是 加 (U = 1) 或 减 (U = 0)。 第 P 和 W 位 决定 
了 预 变 址 还 是 传递 变 址 以 及 写 回 操作 ， 如 图 B-5 和 表 3-1 所 示 。 注 意 对 于 寄存 器 Rm， 只 能 使 用 这 
EEGEN M 


S 15 12 11 


| at HHI: | w = 


L | L sispa 
基 址 寄存 器 
Mi 

: 存储 在 内 存 中 
: 从 内 存 中 加 载 
0: 不 写 回 
1: 将 地 址 写 人 Rn 
字 节 / 字 
0: £ 
1: 字 节 
升值 / 降 值 
0; 从 [Rn] 减 去 偏 移 量 
1: ua s 


Bee 
Et 使 用 偏 移入 
i: 传送 前 使 用 偏 移 量 





0: 偏 移 量 = 无 符号 立即 值 
11 5 3 0 





REE = 移 位 [Rm] (无 符号 ) 
图 B-5 ARM 加 载 和 存储 指令 
表 B-4 向 内 存 或 从 内 存 传送 单字 或 字 节 的 ARM 指 令 
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下 面 是 一 个 内 存 访问 操作 的 例子 。 指 令 
LDR RO, [R1, #100] 
执行 的 操作 是 
RO<—[[R1] + 100] 
它 的 位 设置 情况 是 1=0,P=1,U=1,B=0,W=0 和 L=1。 偏 移 量 的 范围 是 + 4095。 指 令 
LDR Ro, [R1, R2] 
所 执行 的 操作 是 
RO [[R1] + [R2]] 
第 I 位 变 为 1， 其 他 位 的 设置 不 变 。 
当 偏 移 量 被 保存 在 寄存 器 中 时 ， 在 与 基 址 寄存 器 Rn 进行 相 加 减 之 前 ， 可 以 进行 移 位 。 这 个 
移 位 操作 只 能 使 用 图 B-3 所 示 的 5 位 立即 方式 来 指明 。 例 如 ， 指 令 
LDR RO, [R1, — R2, LSL #4]! 
执行 的 操作 是 
RO -[[R1] — 16 x {R2]] 
并 且 有 效 地 址 被 写 回 R1。 这 条 指令 的 位 设置 情况 是 E1，P=1，U=0，B=0，W=1 和 L=1。 
如 果 程 序 计 数 器 R15 被 指定 为 基 址 寄存 器 ， 则 相应 的 寻 址 方式 如 表 3-1 所 示 。 那 么 ， 产 生 操 
作 数 的 有 效 地 址 时 ， 使 用 的 是 带 有 一 个 立即 数 偏 移 量 的 不 带 写 回 的 预 变 址 方式 。 汇 编 语言 允许 
对 操作 数 的 绝对 地 址 进行 命名 。 当 指令 执行 时 ， 汇 编程 序 计算 出 与 程序 计数 器 的 最 新 内 容 相对 
应 的 偏 移 量 值 。 例 如 ， 如 果 指 令 | 
LDR RO, PARAMETER 
被 放 在 地 址 为 1000 的 单元 中 ， 并 且 PARAMETER 代 表 的 地 址 为 1100 的 单元 ， 那 么 汇编 程序 就 会 生 
成 指令 | 
LDR R0, [R15, #92] 


当 偏 移 量 被 加 到 程序 计数 器 的 内 容 中 时 ， 计 数 器 已 经 被 更 新 为 1008， 因 此 偏 移 量 必须 是 92 
才 可 以 得 到 正确 的 访问 地 址 1100=1008+92。 


B.1.3 块 加 载 与 存储 指令 


图 B-6 给 出 了 在 一 块 连续 的 内 存 字 和 16 个 处 理 器 寄存 器 的 特定 子 集 之 间 传 递 数据 的 指令 编 
码 。OP 码 LDM 用 来 将 内 存 操作 数 加 载 到 寄存 器 中 ， 而 STM 用 来 进行 存储 操作 。 在 加 载 操作 中 L 
位 是 1 而 在 存储 操作 中 是 0。 通 过 16 位 寄存 器 列表 的 bs-。 位 中 1 的 位 置 来 指定 所 用 到 的 寄存 器 。 内 
存 中 字符 块 的 开始 位 置 由 基 址 寄存 器 Rn 的 内 容 指定 。 当 第 U 位 为 1 时 块 向 高 位 地 址 运行 ， 而 当 第 
U 位 为 0 时 块 向 低位 地 址 运行 。 由 第 P 位 指定 Rn 采用 的 是 预 变 址 或 传递 变 址 。 由 于 操作 数 通 常 是 
连续 的 4 字 节 ， 所 以 变 址 值 通常 是 4。 当 第 W 位 为 1 时 ， 执 行 成 组 传送 所 得 的 最 终 地 址 将 要 写 回 
Rn; FZ (W = 0)，Rn 中 保存 开始 的 地 址 。 不 考虑 是 否 块 是 向 高 位 还 是 向 低位 地 址 执行 ， 最 小 
的 寄存 器 经 常 与 块 中 最 低 的 地 址 值 关联 。 表 B-5 给 出 了 OP 码 对 P、U 和 L 位 所 有 可 能 设置 值 的 助 记 
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符 。 操 作 码 LDM 和 STM 的 后 缀 表明 了 第 P 位 和 第 U 位 的 设置 值 。 例 如 ， 表 B-5 中 的 第 一 项 P = 0 和 
U = 1 由 后 缀 IA 表 明 ， 即 “ 算 后 增加 ”， 意 思 是 基 址 寄存 器 Rn 的 内 容 在 每 一 次 传送 执行 后 加 4， 这 
表示 Rn 是 传递 变 址 的 。 下 面 解 释 表 B-5 中 列 出 的 可 以 使 用 的 助 记 符 及 其 名 称 。 


31 28 19 16 15 0 
条 件 oo 加- Rn | 寄存 器 列表 | 


| L _ 基 址 寄存 器 
加 载 /存储 


只 有 在 特权 模式 下 有 意义 ， 在 用 户 
模式 下 应 为 0 


Ñ 











观 / 传 递 变 址 U. 
0: 在 每 次 传送 之 后 对 Rn 进行 Inc/Dec 
l: 在 每 次 传送 之 前 对 Rn 进行 Inc/Dec 


图 B-6 ARM 块 传送 指令 


块 传送 的 主要 作用 是 对 进入 子 程序 和 子 程序 返回 的 寄存 器 进行 存储 和 恢复 。 如 果 我 们 假设 
用 R13 做 堆栈 指针 ， 而 R14 (连接 寄存 器 ) 保存 返回 地 址 ， 那 么 表 B-5 中 最 后 一 项 的 指令 
STMDB R13!, (R0— R3, R14) 
的 功能 是 将 寄存 器 R0 中 的 内 容 通过 R3 和 R14 压 和 堆栈 中 。 访 问 低位 内 存 地 址 的 堆栈 和 R0 中 的 内 
容 最 后 被 传送 到 最 低 的 地 址 中 。 表 B-S 中 第 一 项 给 出 了 相应 的 指令 
LDMIA R13!, {R0 - R3, R15} 


将 R0 到 R3 中 保存 的 内 容 弹 回 先前 那些 寄存 器 ， 将 R14 中 保存 的 值 (返回 地 址 ) 弹 到 程序 计数 器 
R15， 完 成 返回 操作 。 最 后 将 最 高 地 址 的 内 容 被 传送 到 R15。 这 两 个 OP 码 的 后 级 DB 和 IA 表 示 
“AR (DB) 和 “后 增 ”(IA)， 描 述 了 基 址 寄存 器 的 内 容 是 如 何 操作 的 。 另 一 种 相同 功能 的 操 
作 玛 助 记 符 (参见 表 B-5) 可 以 由 STMFD 和 LDMFD 的 相同 指令 使 用 。 后 级 FD 代表 “ 满 栈 递减 ”， 
这 是 为 了 描述 堆栈 从 低 内 存 地 址 增长 (减少 ) 和 基 址 寄存 器 R13 中 的 初始 内 容 是 当前 栈 顶 元 素 的 
地 址 〈 满 栈 ) 的 情况 。 对 于 一 个 向 高 地 址 增长 和 使 用 堆栈 指针 越过 当前 项 元 素 指向 空位 置 的 堆 
栈 来 说 ， 描 述 符 的 名 称 是 “ 空 栈 递 增 *， 后缀 为 EA。LDM 和 STM 进 入 和 返回 中 断 服务 程序 指令 
的 使 用 在 第 4 章 中 已 经 讨论 过 。 


B.1.4 转移 与 转移 连接 指令 


图 B-7 给 出 了 转移 和 转移 连接 指令 的 编码 。 偏 移 量 是 一 个 24 位 带 符 号 数 。 它 向 左 移动 2 位 
(所 有 的 转移 对 象 按 字 地 址 排列 )， 符 号 扩展 为 32 位 ， 与 当前 的 PC 相 加 得 到 转移 对 象 的 地 址 。 当 
前 的 PC 指向 转移 指令 下 两 个 字 (8 字 节 ) 位 置 的 指令 。 


目 


= 
> 
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家 B-5 从 或 向 内 存 传送 多 个 字 的 ARM 指 令 


助 记 符 《名 称 ) 。 ， 指令 位 。 执行 的 操作 





LDMIA/LDMFD ee, Raiga ~ [Ra] [Rn] + 4]… 


后 增 / 满 栈 递 三 


LDMIB/LDMED : 1 1 1 | Row, , R high = [[Rn]+ 4], [Ra] + 8], 
先 增 / 空 栈 递减 : 


LDMDADMFA 0 0 1 Raw ,Ri = [Rn] [Ra] -和 
后 减 / 满 栈 递增 x 


LDMDB/LDMEA 1 0 1 Rag .Rio = [Rn] -4} [IRn] — 8). 
ARE 


STMIA/STMEA u 0 1 0 | [Ra], [Rn]+ 4 — Riow h o, Raiga] 
AWRA | 


STMIB/STMFA x 1 1 O x [Rn]+ 4,[Rn]+ 8, 一 [Riow l- , [Raiga ] 
先 增 / 满 栈 递增 — x 


STMDA/STMED | 00 0 . [Rx] [Rn] 一 4, … — Raiga b IR, ] 
后 减 / 空 栈 递 减 | 


STMDB/STMFD 1 0 0 [Rn] -4,[Rn] -8, = — [Russ h = s Rio] 
ERRER — 





31 23 


28 0 
Fan: T 


K=0 :转移 (B) 
K=1 :转移 连接 (BL)， 在 寄存 器 R14 中 存储 返回 地 址 


图 B-7 ARM 转 移 与 转移 连接 指令 
在 汇编 语言 中 允许 使 用 转移 对 象 的 绝对 地 址 。 例 如 ， 指 令 
BEQ ROUTINE 


是 一 个 条 件 转移 指令 ， 在 条 件 Z=1 成 立时 指向 位 置 ROUTINE。 如 果 转 移 指令 地 址 是 2000， 
ROUTINE 地 址 是 3000， 汇 编程 序 将 计算 出 要 插入 指令 的 偏 移 量 248。 那 么 ， 实 际 的 目标 地 址 和 当 
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前 PC 中 的 内 容 2008 的 实际 距离 ， 用 程序 计数 器 计算 是 992。 这 个 值 是 248 左 移 2 位 〈 相 当 于 乘 4 ) 
得 来 的 。 因 此 ， 转 移 地 址 的 计算 方法 是 2008+992=3000。 

转移 连接 指令 (BL) 被 用 来 调用 子 程序 。 在 转移 到 子 程 之 前 ， 紧 跟 在 BL 指 令 后 面 的 指令 的 地 
址 (返回 地 址 ) 被 保存 在 连接 寄存 器 R14 中 。 子 程序 的 返回 问题 在 3.6 节 中 进行 了 介绍 。 


B.1.5 机 器 控制 指令 


软件 中 断 

当 执 行 完 一 个 用 户 程序 后 ， 控 制 由 一 个 软 中 断 指令 转移 到 超级 用 户 程 序 。 在 第 3 章 第 一 部 分 
的 例题 程序 中 ， 我 们 没有 给 出 SWI 指令 。 在 图 3-8 中 程序 的 STR 指令 之 后 给 出 了 需要 立即 使 用 该 
指令 的 一 个 例子 。 正 如 第 4 章 描 述 的 那样 ，SWI 指令 也 是 用 来 转换 控制 操作 系统 子 程序 中 那些 运 
行 在 超级 用 户 模式 下 ， 为 一 个 用 户 程序 执行 输入 /输出 的 操作 。 

表 B-6 给 出 了 汇编 语言 的 SWI 指 令 格式 ， 共 中 包括 执行 的 操作 。 操 作 码 SWI 在 指令 位 字段 的 
bz-n 位 ， 编 码 为 1111。 和 其 他 ARM 指 令 一 样 ， 它 可 以 进行 条 件 执行 。 指 令 低 24 位 包含 了 一 个 在 
执行 指令 过 程 中 被 忽略 的 立即 操作 数 。 用 户 程序 可 以 使 用 这 个 字段 向 操作 系统 传递 一 个 参数 来 
声明 一 个 正在 请 求 的 服务 ， 就 像 1O 操 作 一 样 。 

处 理 器 状态 寄存 器 传送 

保存 在 当前 处 理 器 状态 寄存 器 CPSR 中 的 指令 ， 和 保存 在 处 理 器 状态 寄存 器 SPSR_mode 
( 见 图 3-1 和 图 4-12) 的 指令 主要 被 特权 模式 的 程序 所 使 用 。 在 用 户 程序 中 这 些 指 令 也 允许 有 限 
地 被 使 用 。 当 一 个 外 部 中 断 延 迟 了 用 户 程序 执行 时 ， 当 前 CPSR 的 内 容 自动 保存 在 SPSR_mode 
寄存 器 中 ， 而 调用 一 个 特权 模式 子 程序 来 处 理 中 断 。 这 些 子 程序 必须 熟练 地 处 理 状态 寄存 器 中 
的 内 容 。 这 些 问 题 在 第 4 章 中 进行 了 讨论 。 如 表 B-6 所 示 ，MRS 和 MSR 指 令 用 来 对 CPSR 和 
SPSR_mode 寄 存 器 进行 读 和 写 操作 。 用 户 模 式 和 特权 模式 程序 都 可 以 读 取 状 态 寄 存 器 。 用 户 模 
式 程 序 只 可 以 改写 CPSR 寄 存 器 的 ba -2 位 的 条 件 码 标志 N, Z, V, C。 特 权 模 式 程序 可 以 对 CPSR 
和 SPSR_mode 寄 存 器 全 部 32 位 进行 改写 ,还 可 以 有 选择 地 只 对 条 件 码 标志 进行 改写 。 写 操作 的 
源 操作 数 可 以 是 一 个 通用 寄存 器 中 的 内 容 ， 也 可 以 是 一 个 由 表 B-6 中 用 imm32 指 明 的 一 个 的 32 
位 立即 数值 。 立 即 操作 数 中 只 有 高 4 位 被 使 用 ， 所 以 操作 数 通常 可 以 由 一 条 指令 中 的 8 位 立即 数 
通过 循环 移 位 得 到 。 

在 机 器 指令 格式 中 对 MRS 和 MSR 的 指令 编码 通常 是 用 做 算术 和 逻辑 指令 的 〈 见 图 B-1)。 如 
表 B-3， 这 一 组 中 的 CMP、CMN、TST 和 TEQ 指 令 经 常用 来 置 位 条 件 码 标志 。 因 此 ， 第 S 位 在 这 
些 指令 中 常 被 置 为 1。 当 S 位 置 为 零 ， 描 述 MRS 和 MSR 指 令 的 这 四 个 操作 码 是 对 CPSR 或 
SPSR_mode 寄 存 器 进行 操作 。 其 他 指令 位 用 来 区 分 MSR 指 令 中 的 完全 写 人 或 部 分 写 人 ， 以 及 寄 
存 器 或 立即 源 操作 数 。 

寄存 器 / 内 存 对 换 

对 于 将 内 存 中 的 内 容 读 到 一 个 寄存 器 中 并 且 将 另 一 个 寄存 器 中 的 内 容 写 入 同一 个 内 存单 元 
中 的 不 中 断 操作 ， 系 统 中 提供 了 一 条 指令 。 如 表 B-6 所 示 的 这 个 对 换 指 令 ( 助 记 符 SWP)， 用 
户 或 特权 模式 都 可 以 使 用 。 它 的 主要 作用 是 用 执行 锁 存 变量 的 操作 ， 来 调整 多 处 理 器 结构 间 
程序 共享 内 存 数据 的 正确 运转 。“ 不 中 断 ” 意 味 由 对 换 指 令 执行 的 读 和 写 操作 之 间 不 允许 另 一 
个 处 理 器 访问 内 存 。 寄 存 器 Rm 和 Rd 可 以 是 相同 的 ， 这 样 在 寄存 器 和 内 存 操作 数 之 间 实 现 了 对 
换 操 作 。 
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表 B-6 状态 寄存 器 传送 、 软 件 中 断 和 数据 对 换 的 ARM 指 令 


助 记 符 ( 名 称 ) 指令 格式 ”执行 的 操作 
MRS ”用 户 模式 : x 
(复制 状态 | u 
Atas) MRS RdCPSR Rd ~ [CPSR] 
sus <: 

MRS RdCPSR Rd ~ {CPSR] 

MRS Ra,SPSR | Rd — [SPSR mode] 
MR MPRA x 
(SARA | u 
寄存 器 ) i MSR CPSR,Rm | CPSR 31 -23 — [Rmh -28 


MSR CPSR,imm32 x CPSR 31 -23 ~ imm 3231 -28 


MSR CPSR,Rm x CPSR ~ [Rm] 
MSR CPSR flg,Rm x CPSR 31 -28 ~ [Rm Bi -28 
| MSR CPSR fgimm32 | CPSR 2 ~ imm323 -zs 
MSR SPSRRm ‘SPSR mode — [Rm] 
. MSR SPSR flgRm ‘SPSR modes -x — [Rm ht -2 
MSR SPSR flgimm32 SPSR modes -z — imm323 -s 


SWI x SWI imm24 | R14_svc — updated[PC]; 
(软件 中 断 ) | . SPSR svc ~ [CPSR]; 

| ‘PC ~ 0x08 
SWP | SWP RaRmlRa] Rd- [R]; 


(对 换 ) [Rn] ~ [Rm] 





B.2 其 他 ARM 指 令 


在 这 一 节 中 ， 我 们 简要 描述 一 下 协 处 理 器 指令 和 在 版 本 v4 和 v5 体系 结构 中 介绍 的 指令 。 
B.2.1 协 处 理 器 指令 


不 采用 已 定义 的 ARM 指 令 集 ， 而 是 通过 硬 部 件 来 执行 操作 的 硬件 设备 称 作协 处 理 器 。 其 中 
浮 点 数 操作 的 硬件 设备 就 是 一 个 例子 。 其 他 例子 还 有 在 修 入 式 系统 中 对 数字 信号 或 视频 数据 进 
行 特殊 处 理 的 部 件 。 如 果 在 ARM 处 理 器 设计 中 提供 了 一 个 软件 -综合 形式 ， 就 像 在 第 9 章 和 第 11 
章 中 描述 的 那样 ， 那 么 就 指定 了 一 个 协 处 理 器 的 软件 模块 可 以 通过 处 理 器 的 软件 描述 集成 ， 并 
且 得 到 一 块 单片机 。 在 ARM 指 令 集中 包含 的 指令 模板 简化 了 组 合 单元 的 编程 ， 它 实现 了 指导 协 
处 理 器 执行 操作 ， 在 协 处 理 器 的 寄存 器 和 内 存 间 传 递 数据 以 及 在 协 处 理 器 的 寄存 器 和 ARM 寄 存 
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器 间 传 递 数 据 等 功能 。 
B.2.2 版 本 V4 和 v5 指令 


v3 版 之 后 的 两 个 指令 系统 版 本 中 包括 了 扩展 的 内 存 访问 和 乘法 指令 集 。 版 本 v4 和 v5 具有 加 
载 和 存储 指令 ， 它 们 在 内 存 和 处 理 器 的 寄存 器 间 传 递 有 符号 字 节 和 有 符号 /无 符号 的 16 位 半 字 。 
在 内 部 ，ARM 处 理 器 只 对 32 位 操作 数 执行 操作 。 当 有 符号 字 节 和 有 符号 半 字 使 用 v4 和 v5 指 令 载 
人 处 理 器 的 寄存 器 中 时 ， 它 们 要 执行 符号 扩展 成 为 32 位 。 

v4 和 v5 版 本 也 提供 了 v3 版 (参见 图 B-4) 中 的 MUL 和 MULA 指 令 的 附加 形式 、 并 给 出 了 产生 
64 位 结果 的 这 两 条 指令 的 有 符号 和 无 符号 版 本 。 


B.3 编程 实验 


ARM 网 站 (URL: www.arm.com/hr.ns4/html/SDT202u) 包括 了 可 以 进入 、 编 辑 、 汇 编 、 运 行 
(仿真 ) ARM 汇 编 语 言 程序 的 软件 开发 工具 。 对 于 图 3-8 中 的 程序 ，AREA 指 示 符 应 该 改写 成 
AREA addloop, CODE 
AREA addloopdata, DATA 
来 启动 汇编 程序 。 同 样 ， 正 如 在 B.1.5 节 中 所 描述 的 ， 在 SRT 指 令 后 需要 一 个 形式 为 
SWI Ox123456 
的 软件 中 断 指令 。 


~J 
© 





MRC 
Motorola 68000 指令 集 


本 附录 包括 了 Motorola 68000 指令 集 的 概要 内 容 。 在 第 3 章 的 第 二 部 分 中 我 们 给 出 了 这 款 处 
理 器 主要 特点 的 介绍 性 讨论 ， 其 中 包括 对 寄存 器 结构 和 寻 址 方式 的 描述 ， 这 些 内 容 分 别 包含 在 
图 3-18 和 表 3-2 中 。 注意 表 3-2 还 包括 了 寻 扯 方式 的 汇编 程序 语法 。 

表 C-1 给 出 了 为 一 个 操作 数 地 址 字段 编码 的 通用 格式 。 它 采用 一 个 6 位 的 字段 指定 寻 址 方式 
及 使 用 的 寄存 器 。 对 于 那些 无 需 指明 特定 寄存 器 的 方式 ， 全 部 的 6 位 都 用 来 指明 寻 址 方式 。 

表 C-1 中 寻 址 方式 的 命名 与 本 书 中 使 用 的 一 样 ， 其 中 有 些 与 Motorola 手 册 中 的 不 同 。 因 为 读 
者 会 发 现 参考 制造 商 数据 一 览 表 和 用 户 手册 是 十 分 有 帮助 的 ， 所 以 我 们 在 表 C-2 中 总 结 了 两 者 使 
用 术语 上 的 区 别 。Motorola 术 语 具有 高 度 的 找 述 性 ， 但 是 在 讨论 时 有 些 不 太 方 便 。 

在 本 附录 中 以 表格 的 形式 列 出 68000 指 令 。 为 了 使 该 表格 美观 易 读 ， 表 中 使 用 了 广义 的 符号 
缩写 。 表 C-3 给 出 了 符号 标志 和 它们 的 含义 。 注 意 在 操作 码 字段 中 与 位 模式 相应 的 符号 每 一 位 对 
应 一 个 字母 。 


38C-1 68000 的 地 址 字段 编码 





方式 寄存 器 
5 4 3 2 1 0 
1. 导 址 方式 RI. ,，: 寄存 由宇 段 
直接 数据 寄存 器 000 寄存 器 号 
直接 地 址 寄存 器 001 . 寄存 器 号 
间接 地 址 寄存 器 010 . 寄存 器 号 
自动 增 基 011 寄存 器 号 
自动 减 量 100 . 等 存 器 号 
变 址 基 址 101 FyRI 
变 址 完 110 .寄存 器 号 
绝对 短 ~ HI ` 000 
绝对 长 111 001 
` ` HNF. lll í` 010 
相对 完 111 011 


立即 数 或 状态 寄存 器 。 Hi 100 





表 C-4 给 出 了 变量 指令 的 完整 列表 。 每 条 指令 允许 的 寻 址 方式 都 采用 矩阵 格式 描述 。 对 于 每 
一 个 源 〈 目 标 ) 操作 数 都 提供 了 导 寺 方式 ， 所 有 的 目标 :( 尝 ) 操作 数 允 许 的 寻 址 方式 由 x 表 示 。 
例如 ， 对 于 AND 指 令 来 说 ， 如 果 源 是 一 个 数据 寄存 器 ， 则 目标 操作 数 的 指定 方式 可 能 是 (An). 
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(An +, 


MKC 


- (An). d (An). d (An, Xi)、Abs。W 或 者 Abs 工 。 另 外 ， 如 果 目 标 是 一 个 数据 寄存 器 ， 


源 可 以 指定 表 中 11 种 方式 中 的 任意 一 种 。 


表 C-2 与 Motorola 术 语 的 不 同 





本 书 中 使 用 的 术语 Motorola 中 的 术语 
B +; <+ .， 地址 寄存 器 间接 后 增 
自 减 地 址 寄存 器 间接 先 减 
变 址 基 址 地 址 寄存 器 用 偏 移 量 间接 寻 址 
变 址 完 地 址 寄存 器 用 变 址 间接 寻 址 
相对 基 址 带 偏 移 量 的 程序 计数 器 
相对 完全 带 有 变 引 的 程序 计数 器 





表 C-3 对 表 C-4 中 的 注释 





符号 含义 
s 源 操作 数 
d` 自 标 操作 数 

. An ”地 址 寄存 器 
Dn 数据 寄存 器 
Xn- PEPE EER FE BHOLA BIRATE 

` PC. .程序 计 加 器 : 

. SP 堆栈 指针 

`: SR RG FN 
CCR SR 中 的 条 件 码 标志 
AAA 地 址 寄存 器 数 
DDD 数据 寄存 器 数 
rr 源 寄存 器 数 
RRR 目标 寄存 器 数 
eeeeee 源 操 作 数 的 有 效 地 址 
EEEEEE 目标 操作 数 的 有 效 地 址 
MMM 目标 操作 数 的 有 效 寻 址 方式 
CCCC 指定 条 件 码 检测 
P... P wR ， ;: , 
Q-Q -快速 立即 数据 
SS KE: 00 =[byte, 01 Dord， 10 s[Jong word (对 大 多 数 指令 ) 

oi “byte, 11 word, 10 =Diong word 《对 MOYE 和 MOVEA 指 令 ) 

VVVV 陷阱 向 量 数 
u 条 件 码 标志 状态 不 定 (无 意义 ) 
d(An) 变 址 基 址 寻 址 方式 
d(An,Xi) 变 址 完全 寻 址 方式 
d(PO) 相对 茹 引导 址 方式 
d(PC,Xi) 相对 完 爹 寻 址 方式 





操作 码 一 栏 中 给 出 了 一 条 指令 中 前 16 位 字 的 实际 位 模式 。 具 有 立即 源 数据 的 指令 使 用 8 位 或 
16 位 操作 数 的 第 二 个 字 ， 它 的 第 2 个 和 第 3 个 字 用 于 32 位 的 操作 数 。 对 于 变 址 导 址 和 相对 寻 址 方 
式 ， 所 需要 的 变 址 值 (即位 移 量 ) 由 操作 码 的 下 一 个 字 给 出 。 
移 位 和 循环 移 位 指令 可 以 指明 要 被 移 位 和 循环 移 位 操作 数 的 位 数 。 这 个 数量 可 以 是 数据 寄 


于 1。 


存 器 的 内 容 ， ETER AORERE RRA. RUBARE, 这 个 数 总 是 等 





Motorola 68000 45 +- 3 535 


表 C-$ 中 列 出 了 转移 指令 。 转 移 位 移 ( 偏 移 量 ) 是 一 个 指明 字 节 相对 距离 的 有 符号 的 补 码 。 
对 于 条 件 转移 指令 和 Scc (Set on condition) 指令 ， 表 C-6 给 出 了 条 件 码 后 组 (cc) 的 可 能 情况 。 
表 中 还 给 出 了 检测 判断 是 否 执行 转移 的 条 件 。 

表 C-4 和 表 C-5 说 明了 对 于 一 个 给 定 的 指令 要 执行 的 操作 。 对 大 多 数 指令 来 说 ， 这 个 动作 过 
程 是 显然 的 。 但 是 ， 对 于 一 少 部 分 指令 来 说 ， 需 要 附加 一 些 说 明 。 助 记 符 栏 中 由 星 号 标记 的 指 
令 将 在 接 下 来 的 几 段 中 进行 讨论 。 

BCHG、BCLR、BSET 和 BTST 

所 有 这 些 指令 都 是 对 目标 操作 数 中 的 一 个 特定 位 进行 检测。 需要 测试 位 (bit#) 的 操作 数 可 
以 是 数据 寄存 器 的 内 容 ， 也 可 以 是 一 个 指令 中 的 立即 数 。 检 测 操作 是 将 检测 位 的 补 码 装 入 到 条 
件 标志 Z 中 进行 。 

MOVEM 

这 条 指令 将 一 个 或 多 个 寄存 器 中 的 内 容 移 进 或 移出 一 个 连续 的 内 存单 元 中 。 在 传送 中 所 涉 
及 的 寄存 器 由 指令 的 第 二 个 字 指 明 。0 到 7 位 对 应 着 DO 到 D7，8 到 15 位 对 应 着 A0 到 A7。 除 了 自动 
递减 模式 〈 在 这 种 情况 下 寄存 器 的 顺序 是 预先 设 定好 的 )， 这 种 方式 对 所 有 寻 址 方式 都 有 效 。 

MOVEP 

这 个 指令 对 68000 与 8 位 外 图 设备 之 间 的 数据 传送 很 有 用 。 数 据 是 按 字 节 传送 的 ， 内 存 地 址 
在 每 个 字 节 后 增加 2。 这 样 ， 如 果 开 始 的 地 址 是 偶数 ， 所 有 的 字 节 根据 数据 总 线 的 高 8 位 线 从 偶 
数 地 址 位 置 向 内 或 向 外 传送 。 类 似 地 ， 如 果 开 始 地 址 是 奇数 ， 所 有 的 传送 通过 数据 总 线 的 低 8 位 
线 来 完成 。 数 据 寄存 器 的 高 位 字 节 首先 被 传送 ， 然 后 是 低位 字 节 。 

68000 有 两 个 基本 操作 模式 。 在 管 态 模式 下 ， 所 有 的 指令 都 可 以 使 用 。 在 用 户 模式 下 ， 有 些 
指令 不 能 执行 。 只 能 在 管 态 模 式 下 使 用 的 指令 称 为 “特权 指令 *。 它 们 是 

。 当 目标 是 状态 寄存 器 SR 时 的 ANDI、EORI、ORI 和 MOVE 指 令 。 

*。 当 从 一 个 地 址 寄存 器 向 内 或 向 外 传送 用 户 堆栈 指针 时 的 MOVE 指 令 。 

*。RESET、RTE 和 STOP 指 令 。 

读者 可 以 使 用 本 附录 中 给 出 的 信息 来 编写 和 调试 68000 的 汇编 语言 程序 。 汇 编 指令 的 大 小 和 
结构 是 根据 给 出 的 OP 码 和 使 用 的 寻 址 方式 来 决定 。 由 于 篇 幅 有 限 ， 这 里 没有 包含 时 序 信息 ， 比 
如 需要 执行 一 个 给 定 指令 的 机 器 周期 数 等 。 这 些 信息 以 及 指令 集 的 更 多 具体 细节 可 以 在 制造 商 
手册 中 找到 。 | 
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表 C-4 68000 


MEHR 


寻 址 方式 


助 记 符 (名 称 ) 


人 sss 


Oh 9) 


; s= Immed3 








ANDI 


) 


《与 立即 数 
A 


SL. 


QQQ 


RAH) 


( 算 
— 


(检测 位 并 对 其 修改 ) L 











并 对 其 消除 ) 


检测 位 


( 








Motorola 68000 #+- # 


指令 集 





操作 码 b's… bo 







f 
i 


1 
t 





1100 RRR1 0000 Orr dv [shHdHHX1 x 
1100 RRR1 0000 lm A 一 进 制 编码 的 十 进 制 加 法 
1101 DDD1 SSEE EEEE | Ë ~ [pntldl x x |x 
1101 DDD0 SSee eeee — [sj+[Dn] | x 
1101 AAAO llee e eeee p — [sq+[An] 
1101 AAA! llee eeee pi | 
0000 0110 SSEE FEFE T ds — s 


0101  QQQ0 SSEE EERE 





1101 RRR1 SS00 Orr 


1101 RRR1 SS00 Irr 


1100 DDD1 SSEE EEEE 
1100 DDDO SSee eeee 





D010 SSE == Le 


1110 QQQ1 SS00 0DDD 
1110 0001 llEE EEEE 


1110 QQQ0 SS00 0DDD 
1110 0000 11EE EEEE / 


0000 ml 01EE EEEE 
0000 1000 OIEE EEEE 
0000 rrl OIEE EEEE 
0000 1000 OIEE EEEE 


0000 ml 10EE EEEE 
0000 1000 10EE EEEE 
0000 mr! 10EE EEEE 
0000 1000 10EE EEEE 













[a = oor 


° 





—— 


| Z ~ (bitt of d) ; 
， 之 后 对 d 中 被 检测 位 求 补 





i i! 
— 








— senan aes iomann maerens 
f 

— 

Í 

H 
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HRC 

















LM H H H 
i vvv 








JAI 


f lf H E 
z: 


i 
FEE 
oA 








立 ) 





š 
Bi 
xx 
等 
£ 
z 
E 
g 


P 
im 
im 


助 记 符 〈 名 称 ) 
BTST* 
(检测 
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756 


TMB) 


《比较 


CMPM 


(比较 内 存 ) 
DIVS 





有 符号 除法 ) 


DIVU 





CASS) | 


EOR 





《逻辑 异 或 ) 
EORI 


立即 数 ) 


(FR 











(交换 ) 











Motorola 68000 指令 全 


操作 码 bs bn 执行 的 操作 


Te 


0000 mrl 11EE EEEE 
0000 1000 11EE EEFE 
0000 rrl 11EE EEEE 
0000 1000 11EE EEEE 


0000 rrl 00EE EEEE 
0000 1000 00EE EEEE 
0000 rrl 00EE EEEE 
0000 1000 00EE EEEE 


Ze- (bit# of d); 
之 后 将 4 中 检测 的 位 置 






| Z = (bit# of d); 


0100 DDD1 10ee eeee 





1011 DDDO SSee ceee ja- is} 





i 
; 
j 
i 


i 
ZEEN SEE S sss l 





1011 AAA0 llee eeee 
1011 AAA! llee ceee 


1011 RRR1 SS00 lrr 





1000 DDD1 llee ceee C Il + [el using 


pamapa, x s 为 16 位 





1000 DDDO llee eese — d < [d] + [s], using 


1011 ml SSEE EEEE — d ~ [Dn] endl 


i 
j 
i 
| 
f 
i 
W! 
Bi 





0000 1010 SSEE EEEE 


1100 DDD1 0100 0DDD | 
1100 AAA1 0100 1AAA | 
1100 DDD1 1000 1AAA | 


———htÑ 


0100 1000 1000 0DDD 
0100 1000 1100 0DDD 











i 
i 
p 
i 


其中 4 是 32 位 ， 2 _ 


i | (bits 15 -8 of d) — Cbit 7 of d) f 





| (bits 31—16 of d) ~ (bit 15 of d) 
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( 续 ) 













ee 


T 
i 





Ci 


Ce 


HRC 


540 


AD 10 AS 




















助 记 竺 (名称) 


(W) 


JSR 


〈 跳 转 到 子 程序 ) 


( 载 人 有 效 地 址 ) 


LINK 


(连接 与 分 配 ) 


OEWER) 


— t 


(逻辑 右 移 ) 


758 























Motorola 68000 3 + # 


WHEE bis- bo 


0100 1110 11EE EEEE 





.PC — AtA 38 hb hk 
0100 1110 10EE EEEE : SP ~ [SP]-4; 
| ISP) ~ IPC); 


0100 AAA1 llee eeee 


ee w inawa 


An s 的 有 效 地 址 


0100 1110 0101 OAAA | SP ~ [SP] 一 4; 
| [SP] — {An}; 
‘ An 一 [SP]; 


1110 rrl SS10 IDDD | 
1110 QQQl SS00 IDDD | 操作 数 


1110 0011 11EE EEEE Ix 
1110 0011 11EE BEEE Be o ooo 


1110 mr0 SS10 IDDD | 

:0 C 
1110 QQQo SS00 IDDD | RFR 中 
1110 0010 11EE EEEE | 


JOSS RRRM MMS mee I A 一 g 本 


0100 0100 llee eeee | CCR ~ [bits 7—0 of s] 
0100 0110 1lee eeee SR ~ [s] 
0100 0000 11EE EEEE d — [SR] 
0100 1110 0110 1AAA d ~ [SP] 
0100 1110 0110 0AAA SP ~ [d] 








PC- AfA At 








| SP ~ [SP] + disp i 






和 








00SS AAA0 Olce cece DON 


i 
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X2 io wS | 




















个 寄存 器 ) 





助 记 符 (名称) 
CD 
《有 效 地 址 压 栈 ) 


(FYH) 

无 操作 ) 
NOT 
( 求 补 ) 


(无 符号 乘 ) 
——— O 


《传送 外 围 数据 ) 


一 一 
NEG 

( 非 ) 

NEGX 


MOVEM* 
(传送 多 
PEA 








Motorola 68000 ##+-# 


( 续 ) 





操作 码 bs… Do 


0100 1000 10EE EEEE 
0100 1100 10ee eeee 
0100 1000 11EE EEEE 
0100 1100 llee eeee 





0000 DDD1 1000 IAAA 
0000 DDD1 1100 IAAA 
0000 DDD1 0000 IAAA 
0000 DDDI 0100 IAAA 


0111 DDD0 QQQ QR 


1100 DDD1 1lee eeee 


1100 DDDO 1! lee eeee 


0100 1000 00EE EEEE 
aou Qusa SOE iE ee 


0100 0110 SSEE EEEE 





4 的 可 用 字 节 ~ [Do] 


x Dn ~ QQQ 








d = 0 — [d] - IX] 
， 使 用 BCD 算 术 





MSAMA 
存 器 





Dn -4 的 可 用 字 池 


"a Tue —— 11... 


= [s] x [Dn] 


- D 





1000 DDD1 SSEE EEEE 
1000 DDD0 SSee ceee 


0000 0000 SSEE EEEE — 











de [s] VId] ` 


Ki | 





P — [SP] — 4: 
| [SP] 一 s 的 有 效 地 址 
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DD 10 wS 








W C 


















1) 
加 并 恢复 CCR ) 
二 一 一 一 十 一 





记 符 名称) 


助 
O 


` 


带 X 的 循环 右 移 ) w 
返 
T: 


不 带 X 的 循环 左 移 ) w 
4 


R 
( 
" 
( 


( 带 X 的 循环 右 移 ) 
(从 异常 返 巴 
( 
x 
(从 子 程序 返回 ) 
(设置 条 件 

P 
( 载 人 SR 并 停止 ) 


R 
S 


544 


A 
© 
= 
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( 续 ) 










IREI bis- bo 


执行 的 操作 
0100 1110 0111 0000 


ARESETA HIF 








1110 mrl SS11 1DDD 
1110 QQQ1 SS01 1DDD 
1110 OLII 11EE EEEE 


1100 mrl SS11 1DDD 
1110 QQQ0 SS01 1DDD 
1110 0111 11EE EEEE 


1110 mrl SS11 ODDD 
1110 QQQ1 SS01 0DDD 
1110 0101 11EE EEEE 


1110 m0 SS11 ODDD l 
1110 QQQ0 SS01 0DDD 
1110 0100 11EE EEEE 





SR ~ [[SP]]; 
SP ~ [SP] + 2; 
PC < [ISPI]; 
| SP ~ [SP] + 4; 


0100 1110 0111 0111 CCR ~ [[SPITI; 

| SP ~ [SP] + 2; 

PC ~ [LSP]]; 

| SP — [SP] + 4; 
| PC ~ [IISP]]; 

SP — [SP] + 4 


d- 


| 

| 

i 

I 
1000 RRR1 0000 Irr | 二进制 编 码 的 十 进 制 碱 法 | 

Í 





f 

上 

| 

Í 
——@I Y 


0101 CCCC 11EE EEEE | 如 果 cc 是 真 ， 将 d 的 全 部 8 位 置 成 1， 


| 否则， 将 它们 清 成 9 | 


— 


0100 1110 0111 0010 
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HRC 
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HIIR sa 





X29 0 yS 











寻 址 方式 





s= Dn 
s= Immed4 


(溢出 陷阱 ) 
= 
(检测 ) 
UNLK 

( 非 连接 ) 


(陷阱 ) 
== 





TAS 


(对 换 寄存 器 的 
高 低位 ) 
(检测 与 置 位 ) 


(扩展 减法 ) 
— 


SUBA 
(h) 


助 记 符 (名 称 ) 
SUB 
人 
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( 续 ) 





操作 码 b's… bo | 执行 的 操作 
1001 DDDI SSEE EEEE 加 
100! DDD0 SSee eeee 


d< ld] -9 


1001 AAAO llee eeee | An < [An] ~ [s] 


1001 AAA1 ilee eeee 


3109 s= — a yU a - 一 e 


0101 QQQI SSEE EEEE | d ~ [d] - QQQ 
1001 RRR1 S$00 Orr- | d — [d] — [s] - [X] 
1001 RRRI SS00 Imr | 


0100 1000 0100 0DDD — [Dn] -16 *+0Dnlis -o 


0100 1010 11EE EEEE | MMA RIN S ZENS; 将 4 的 


第 7 位 置 1 

SP — [SP] — 4; 
[SP] - [PC]; 
SP ~ [SP] - 2; 
[SP] — [SR]; 
PC < vector 


和 


0100 1110 0111 0110 


0100 1110 0100 VVVV ` 





SP ~ [SP] ~ 4; 

[SP] — [PC]; 

SP <— [SP] - 2; 
[SP] ~ (SRJ; 

PC. ~ TRAPV vector 













i 
0100 1010 SSEE EEEE | 
| 测试 4 并 等 位 N 和 2 标志 
0100 1110 0101 1AAA j SP — [An]: 
| An ~ [(SP]J; 
| SP ~ [SP] + 4 
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表 C-5 68000 的 转移 指令 





助 记 符 〈 名 称 ) RBRKE Mem 执行 的 操作 


,0100 0000 PPPP PPPP — PC + [PC] + disp 


(总 是 转移 ) — 16 “0110 0000 0000 0000 x 

u ‘PPPP PPPP PPPP PPPP ` 
Bcc 8 ‘O110 CCCC PPPP PPPP If ce is true, then 
(条 件 转移 ) | 


x 0110 CCCC 0000 0000 : PC ~ [PC] + disp 
: PPPP PPPP PPPP PPPP ` 


BSR 





01100001 PPPP PPPP | SP ~ [SP] -4; 

l i ; [SP] — [PC]; 

( 转 到 子 程序 ) 16 -0110 0001 0000 0000 ' PC ~ [PC] + disp 
| ‘PPPP PPPP PPPP PPPP | 


0101 CCCC 1100 IDDD  I0cc is false, then 
‘PPPP PPPP PPPP PPPP | Dn ~ [Dn] - 1; 





; PC ~ [PC] + disp 


| 汇编 程序 将 此 指令 翻译 为 DBF 
(递减 并 转移 ) “| (参见 DBcc 表 项 ) 





3C-6 用 于 Bcc、DBcc 和 Scc 指 令 的 条 件 码 





机 器 码 
cccc RHEA 名 称 检测 条 件 





0000 
0001 
0010 
0011 
0100 
0101 
0110 
0111 


T 真 “AK 
F 
HI 
LS 
CC 
CS 
NE 
EQ 
1000 vc 溢出 清 及 
VS 
PL 
MI 
GE 
LT 
GT 
LE 


假 总 为 假 
C vz 


一 © 


1001 
1010 
1011 
1100 
1101 
1110 
1111 


I lI l Hú H H H H < 


= — e° ° N 


SS 


一 O 


大 于 
小 于 或 等 于 


R£ 

EE 

mi 

= 
NNZZZZ<<NNOANAN 


<< 
22 
$ 


$ 





2k: T 和 F 后 缓 不 能 用 在 Bcc 指 令 中 。 
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MD 
Intel IA-32 指 令 集 


本 附录 是 对 第 3 章 第 三 部 分 介绍 的 Intel IA-32 指 令 集 的 概述 。 这 个 指令 集 十 分 庞大 。 我 们 只 找 
述 其 中 很 小 的 一 部 分 ， 大 约 50 条 指令 ， 其 中 包括 了 第 3 章 中 所 有 用 到 的 指令 。 另 外 还 概要 介绍 了 
其 他 指令 类 型 的 一 些 特点 。 

图 3-37 和 图 3-38 给 出 了 IA-32 寄 存 器 的 结构 ， 我 们 在 3.16.1 节 中 对 其 做 了 描述 。 图 3-41 给 出 了 
指令 的 一 般 格 式 。 内 存 是 按 字 节 寻 址 的 ， 且 地 址 长 度 是 32 位 和 的。 指令 中 可 以 使 用 两 种 操作 数 : 双 
F (32 位 ) 和 字 节 (8 位 )。 早 期 的 16 位 Intel 处 理 器 使 用 字 操 作 数 《16 位)。IA-32 处 理 器 可 以 按 16 
位 模式 执行 早期 16 位 处 理 器 所 编写 的 机 器 程序 。 


D.1 指令 编码 


图 D-1a 给 出 了 IA-32 指 令 编码 的 一 般 格 式 、OP 码 长 座 可 以 是 1 或 2 个 字 节 。 如 图 D-1b 所 示 ， 对 于 一 
些 指令 来 党 ，OP 码 在 ModR/M 字 节 被 扩展 到 3 位 Reg/DP 码 字段 。 由 于 OP 码 的 编码 非常 不 规则 ， 所 以 不 
再 进行 详细 的 讨论 。 前 级 字 节 是 大 多 数 普通 指令 编码 时 所 不 需要 的 ， 我 们 将 在 D.3 节 中 进行 介绍 . 


~4 字 节 1 或 2 字 节 1 字 节 ”1 字 节 ”1 或 4 字 节 1 或 4 字 节 


Tm pe wT 


”测试 
a) 一 般 格 式 


c) SB 字 节 
图 D-1 IA-32 指 令 格式 


769 





心 
J 
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一 条 指令 长 度 的 范围 可 以 从 1 个 字 节 (一 个 OP 码 ) 到 11 或 更 多 字 节 ( 即 当 同时 指明 了 一 个 4 
字 节 的 位 移 量 和 一 个 4 字 节 的 立即 操作 数 以 及 2 个 寻 址 方式 字 节 和 OP 码 时 )。 例 如 ， 对 一 个 寄存 器 
操作 数 的 递增 (INC) PER (DEC) 指令 只 需要 一 个 3 位 字段 的 单字 节 OP 码 来 命名 寄存 器 。 下 
面 举 一 个 长 指令 的 例子 : 

MOV DWORD PTR [EBP + ESI*4 + DISP], 10 

正如 在 第 3.17.1 节 中 讨论 过 的 那样 ， 这 个 指令 编码 需要 11 个 字 节 。 在 那 一 节 中 还 举 了 一 些 其 他 指 
令 的 例子 。 

操作 数 的 数据 大 小 (8 位 或 32 位 ) 在 OP 码 中 指出 。OP 码 还 指出 在 指令 中 是 否 有 一 个 操作 数 
是 立即 数 ， 如 果 有 的 话 ， 该 立即 数 包含 在 指令 中 的 最 后 一 个 表 D-1 IA-32 指 令 中 的 寄存 器 编码 
字段 中 。 — 

一 个 双 操作 数 指令 中 至 少 有 一 个 操作 数 是 必须 放 在 寄存 器 。 Reg/ 基 址 / 谈 址 "字段 EA 
中 的 。 它 是 在 ModR/M 字 节 的 Reg/OP 字 段 中 指定 的 。 寄 存 器 的 r V 


000 ，EAX 


3 位 码 如 表 D-i 所 示 。 如 果 另 一 个 操作 数 也 在 寄存 器 中 ， 它 会 在 001 . ECX 
同一 个 字 节 的 RM 字段 中 命名 。 如 果 另 一 个 操作 数 不 在 寄存 器 019 3 

里 ， 它 可 能 是 一 个 立即 值 或 者 是 一 个 内 存单 元 的 内 容 。 下 一 节 100 ESP 
中 将 介绍 ， 一 个 内 存 操作 数 的 地 址 由 两 个 寻 址 方式 字 节 和 偏 移 110 . ESI 

量 指明 。 正 如 3.17.1 节 中 所 描述 的 ， 在 对 一 个 双 操 作 数 指令 编 111 EDI 
码 的 过 程 中 ， 哪 个 操作 数 是 源 由 OP 码 中 的 方向 位 来 决定 。 De 
寻 址 方式 


表 3-3 列 出 了 IA-32 寻 址 方式 , 通常 用 汇编 程序 的 语法 来 说 明 它们 以 及 有 效 地 址 EA 的 产生 方式 。 
我 们 已 经 讨论 了 立即 方式 和 使 用 ModRVM 字 节 的 Reg/OP 码 字段 指明 一 个 操作 数位 置 的 寄存 器 的 情 
况 。 另 外 一 个 操作 数 的 指定 情况 如 表 D-2 所 示 。 表 中 前 4 行列 出 了 由 ModRVM 字 节 的 2 位 Mod 字 段 决 
定 的 间接 寄存 器 、 带 位 移 的 基 址 和 寄存 器 寻 址 方式 。3 位 RHM 字 段 通常 指明 了 这 些 方式 中 所 涉及 
的 寄存 器 (Reg). 除 此 之 外 的 内 容 被 用 来 产生 表 中 所 列 出 的 其 余 寻 址 方式 。 除 了 直接 方式 以 外 所 
有 方式 都 使 用 SIB 字 节 ， 如 图 D-1c 所 示 。SIB 字 节 将 基 址 和 变 址 寄存 器 按 表 D-1 进 行 编码 。 比 例 因 
子 1，2，4，8 的 编码 如 表 D-3 所 示 。 

正如 表 3-3 指 出 的 ，ESP 寄 存 器 (编码 100) 不 能 被 用 做 变 址 寄存 器 。 事 实 上 这 并 不 是 程序 的 
限制 ， 而 是 因为 ESP 将 作为 处 理 器 堆栈 指针 。 当 位 模式 100 存 在 于 SIB 字 节 的 变 址 字段 中 时 ， 不 使 
用 任何 比例 变 址 ， 但 寻 址 方式 的 其 他 组 成 部 分 通常 会 正常 地 产生 操作 数 的 有 效 地 址 。 这 样 做 有 如 
下 好 处 。 从 表 D-2 可 以 看 出 ，ESP 不 能 在 所 列 的 前 三 种 方式 中 使 用 ， 因 为 ESP 编 码 (100) 被 用 来 
表示 产生 表 中 后 3 种 方式 。 但 如 果 100 同 时 存在 于 SIB 字 节 的 基 址 和 变 址 字段 中 ， 由 于 不 使 用 变 址 ， 
可 以 使 用 ESP 作 为 基 址 寄存 器 产生 表 中 的 前 三 个 寻 址 方式 。 

注意 为 了 产生 带 32 位 位 移 量 的 变 址 方式 ， 编 码 为 101 的 基 址 寄存 器 被 用 做 带 变 址 的 基 址 寻 址 
方式 的 异常 (exception)。EBP 寄 存 器 还 可 以 在 带 变 址 的 基 址 方式 中 ， 以 及 在 带 有 位 移 量 的 变 址 基 
址 的 方式 中 (只 要 位 移 量 设 成 0) 作为 基 址 寄存 器 使 用 。 





表 D-2 由 ModR/M 和 SIB 字 节选 择 的 IA-32 导 址 方式 


MINK 





间接 寄存 器 
: EA = [Reg] 


0 1 Reg 带 8 位 位 移 量 的 基 址 寄存 器 
x EA = [Reg] + Disp8 

1 0 Reg 带 32 位 位 移 量 的 基 址 寄存 器 
i : EA = [Reg] + Disp32 


11 Reg ”| 寄存 器 
| ` EA = Reg 








00 101 “直接 寄存 器 
: i EA = Disp32 


00 100 和 带 变 址 的 基 址 案 存 器 (使 用 SIB 字 节 
| EA = [Base] + [Index] x Scale 


x 当 Base=EBP 导 址 方式 是 : 


， 变 址 带 32 位 位 移 量 
EA = [Index] x Scale + Disp32 


0 1 100 带 变 址 和 8 位 位 移 量 的 基 址 寄存 器 (使 用 SIB 字 节 ) 
i : EA = [Base] + [Index] x Scale + Disp8 


10 100 带 变 址 和 32 位 位 移 量 的 基 址 寄存 器 〔 使 用 SIB 宇 节 ) 
i : EA = [Base] + [Index] x Scale + Disp32 





D.2 基本 指令 


经 常 使 用 的 IA-32 指令 在 表 D-4 中 按照 字母 顺序 列 出 。 除 了 在 3.21.3 节 中 的 IO 块 传送 使 用 的 
跳 转 指令 和 有 重 写 选项 的 特殊 串 指 令 外 ， 表 中 包括 了 所 有 在 第 3 章 中 使 用 过 的 指令 。 下 面 的 两 个 
小 节 描 述 了 条 件 跳 转 指令 和 无 条 件 跳 转 指 令 。 串 指 
令 在 D.4 节 中 进行 描述 。 表 D-4 的 第 1 列 中 给 出 了 OP 
码 助 记 符 和 指令 名 称 。 第 2 列 指明 了 可 以 使 用 的 操作 
数 长 度 : B (FH) 或 者 D (32 位 双 字 )。 第 3 列 给 出 
了 源 操 作 数 和 目标 操作 数 的 可 能 位 置 ， 简 写 为 : 

reg — 8 个 处 理 器 寄存 器 之 一 

mem — 一 个 存储 单元 

imm 一 一 个 8 位 或 32 位 立即 操作 数 

imm8 — 一 个 8 位 立即 操作 数 


囊 D-3 IA-32 SIiB 字 节 中 比例 字段 编码 





ban 
t 
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表 D-4 IA-32 指令 





助 记 符 (ZED KE 。 操作 数 ”执行 的 操作 ， 受 影响 的 CC 标志 


ADC 
( 带 进位 加 ) 





reg x dst «~ [dst] + [src] + [CF] x 


ADD BD reg reg dst ~ [dst] + [src] 
(加 ) x 





AND B,D x reg reg x dst 二 [dst] ^ [src] 
G C — x 







| bit# = [src]; i 
| CF < bit# of [dst] 


BTC x 
(位 检测 并 求 补 ) 


| ' bit# = [src]; | i | 
reg imm8 CF «~ bit# of [dst]; E 丘 呈 时 时 
| ` complement bit# | 
of [dst] | 








BTR | 
(位 检测 和 复位 ) 





, bit# = [src]; 
CF ~ bit# of [dst]; 
‘ clear bit# of [dst] to 0 
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助 记 符 名称) 。 长 度 


BTS :D 


(位 检测 和 置 位 ) 


CALL D 


(调用 子 程序 ) 


CLC x 
(清除 进位 ) | 


CLI 
《清除 整数 标志 ) 


CMC 
〈 求 补 后 进位 ) 


ee 


(无 符号 除 ) 










.ESP ~ [ESP] - 4; 
: [ESP] «~ [EIP]; 
‘EIP ~ EA of dst 


‘CFE-0 


x EDX- 4k 


353 


( 续 ) 


执行 的 操作 要 影响 的 CC 标志 





‘ CF ~ bit# of [dst]; ` | 
.set bit# of [dst] to 1 ， 








对 于 B: ES 
mem | 





[ALJ[src]; 
AL - H; 
AH ~ 余数 


IEAXJsrc]; 
EAX ~ Ñ; 
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助 记 符 〈 名 称 ) 


IDIV 
(有 符号 除 ) 


IMUL 


(有 符号 乘 ) 


(软件 中 断 ) 


BD 


: B,D 








dst Src 


| reg 
| mem 


" 
x 


imm8 


执行 的 操作 


暂停 操作 直到 产生 复位 或 
外 部 中 断 为 止 


对 于 B: 
[ALV[src]; 
AL ~ Ñ; 
AH - 余数 


对 于 D: 


[EAXY/[src]; 
EAX ~ 商 ; 
EDX — 余数 


， 双 倍 长 度 乘积 
x 对 于 B: 


AX — [AL] x [src] 
对 于 D: 
EDX,EAX ~ [EAXJ 
x [src] 


,〈 单 长 度 乘积 ) 


‘reg < Ireg] x lsrc] 


.AL 或 EAX “~ [src] 


dst ~ [dst] + 1 


Push EFLAGS; 
' Push EIP; 

EIP - 地 址 
(由 immg 决 定 ) 





( 续 ) 





受 影 响 的 CC 标志 

















B D 
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助 记 符 (名 称 ) kñ | 


IRET D 
(EE) 


LEA | 
(加 载 有 效 地 址 ) ， 





循环 ) 





(在 不 等 / 非 零 时 | 
循环 ) 


MOV 
(移动 ) 


MOVSX B 


(符号 扩展 字 节 | 
到 寄存 器 ) 





—— 


操作 数 





dst 


target 
target 


reg .dst ~ [src] 
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( 续 ) 


执行 的 操作 


受 影响 的 CC 标志 








' Pop EIP; 
| Pop EFLA GS 


reg ~ EA of src 


ECX ~ [ECX] - 1; 


If ( [ECX] = 0 ) 
© EP ~ target 


| ECX ~ [ECX] - 1; 

` If ( [ECX] +0 
-^ [Z]= 1) 
EIP - target 






i ECX ~ [ECX] - 1; Í Í | 
If ( [ECX] = 0 E 
© ^ [Z] *1) í 

EIP ~ target : 





mem 
reg | 





reg reg — 符号 扩展 


mem : 
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助 记 符 (名 称 ) 


MOVZX 


( 零 扩 展 字 节 到 
寄存 器 ) 


(逻辑 补 码 ) 
OR 
(逻辑 或 ) 


KE 





( 续 ) 





操作 数 。。。 “执行 的 操作 到 影响 的 CC 标志 








dst src | 


reg reg x reg — 零 扩展 [src] 
reg mem f 


| i 
| : 


reg | (REKREO 


mem ;对 于 
u AX ~ [AL] x [src] 





dst ~ [dst] 


reg dst — [dst] V [src] 
mem ， 


| dst — [AL] 或 [EAX 


B D 
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( 续 ) 





助 记 符 (名称) | 长 度 。 ”操作 数 。 ”执行 的 操作 | 要 影响 的 CC 标志 


sc | 


` dst ~ [IESP]; 
| ESP - [ESP] + 4 


POP 
(弹出 堆栈 ) 





POPAD 了 从 梭 中 弹出 8 个 双 字 到 


(EP | EDI, ESI, EBP, discard, 
寄存 器 所 有 堆 | . EBX, EDX, ECX, EAX; ， 
#) x | ESP ~ [ESP] + 32 
PUSH D rg ESP = [ESP] -4 | 

| i mem f [ESP] ~ [src] : 











(将 所 有 寄存 器 ， ， ESP, EBP, ESI, EDI | 
压 栈 ) u u BRAA: | 
x ESP = [ESP] -32 













immg | 参见 图 2-32b; 
CL 源 操 作 数 
8 “| 是 循环 计数 的 


RCL u 


{ 使 用 C 标 志 循 
环 左 移 ) 


RCR : | 参见 图 2-32d; 


` CL RAFE 
HE) | 是 循环 计数 的 





_EIP ~ [IESP]]: 
ESP ~ [ESP] + 4 





(从 子 程序 返回 ) 
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助 记 符 (名称) 长度 。 操作 数 。 | ”执行 的 操作 


ROL BD rg imm8 
f ' reg CL :参见 图 2-32a; 


(循环 左 移 ) mem imm 源 操作 数 是 循环 计数 的 


i 


ROR x 
| 参见 图 2-32c; 










(循环 右 移 ) 


SAL 
.参见 团 2.309; 


(算术 左 移 ) 源 操作 数 是 移 位 计数 的 


与 SHL 相 同 


.参见 图 2-30c: 


— ua. 


- [CF] 


(人 异 位 减 ) x mem reg 


SHL x x | 
(EB) x eg CL 参见 图 2-30a; 


与 AL 相同 u mem img | ! 源 操作 数 是 移 位 计数 的 | 





I 
Í 


可 作 数 是 和 位 计数 的 


| 源 操作 数 是 循环 计数 的 ; 





| | dst 一 [äs] _ _ ge] 


i 
i 
i 
i 
i 
Í 
i 
| 
l. 





( 续 ) 


， 受 影 响 的 CC 标志 








HRD 
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( 续 ) 





mis 名称) KE 


STC | 
(时 位 进位 标志 ) | 


i 


STI u 
(时 位 中 断 标志 ) 


SUB 





操作 数 执行 的 操作 


dst src 

reg immi ， 参见 图 2.30b; 
imm8 : 源 操 作 数 是 移 位 计数 的 ， 
mem CL : : 


受 影响 的 CC 标志 








reg reg 
reg mem 
mem reg 


dst < [dst] — [src] ; x x 


+ 


' [dst] ^ [sre]; 
根据 结果 设置 标志 


` [reg] —*[lsrc] 


T 


dst ~ [dst] @Usrl x x |0 
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在 第 4 列 中 给 出 指令 执行 的 操作 。 最 后 一 列 指明 使 用 如 下 符号 表示 执行 指令 时 条 件 码 标志 所 
受 的 影响 : 


x 一 受 影响 

0 一 置 为 0 

1 一 置 为 1 

“空白 ”一 不 受 影响 

? 一 不 可 预测 
D.2.1 条 件 跳 转 指令 


表 D-5 中 列 出 了 条 件 跳 转 指令 。 正 如 在 第 3.19.1 节 中 讨论 过 的 那样 ， 目 标 地 址 直接 在 汇编 语言 
程序 中 使 用 。 实 际 上 机 器 指令 中 包含 着 一 个 带 符号 的 数 ( 偏 移 量 )， 它 按 字 节 方式 指明 了 与 当前 
指令 指针 寄存 器 相关 的 目标 地 址 之 间 的 距离 。 偏 移 量 可 以 使 用 两 种 长 度 : 1 字 节 和 4 字 节 。 当 把 一 
个 汇编 语言 程序 转变 为 机 器 语言 时 ， 汇 编程 序 会 计算 偏 移 量 。 


表 D-5 |IA-32 条 件 跳 转 指令 








助 记 符 条 件 名 称 条 件 码 检测 
JS 符号 (负数 ) SF= 1 
JNS 无 符号 〈 正 数 或 0) SF = 0 
JE/JZ 相等 /为 0 ZF=1 
JNE/JNZ 不 等 /不 为 0 ZF=0 
JO 溢出 OF=1 
JNO 不 溢出 OF = 0 
JC/JB 进位 /无 符号 小 于 CF = 1 
JNC/JAE 无 进位 /无 符号 大 于 或 等 于 CF=0 
JA 无 符号 大 于 CFVZF=0 
JBE 无 符号 小 于 或 等 于 CFVZF= 1 
JGE 有 符号 大 于 或 等 于 SF QPF = 0 
JIL 有 符号 小 于 SF @[DF = 
JG 有 符号 大 于 ZF V (SF @[DF) = 0 
JLE 有 符号 小 于 或 等 于 ZF v (SF @[DF) = 1 





D.2.2 无 条 件 跳 转 指令 


在 3.19.2 节 描述 了 无 条 件 跳 转 指 令 JMP。 和 在 条 件 跳 转 中 使 用 的 相对 寻 址 方式 一 样 ， 普 通 的 
寻 址 方式 也 可 以 用 来 指定 目标 地 址 。 这 为 实现 高 级 语言 选择 CASE 语 句 中 的 多 路 分 支 提供 了 更 大 
的 便利 。 


D.3 前 缀 字 节 


如 图 D-1a 所 示 ， 指 令 前 组 字 节 被 分 成 4 组 。 指 令 中 可 以 使 用 多 个 前 绥 字 节 。 但 是 ， 每 一 组 中 
一 次 只 能 使 用 一 个 字 节 。 第 一 组 包括 重复 字 节 码 来 表明 指令 操作 需要 重复 一 定 的 次 数 。 具 有 这 种 
选择 的 指令 称 为 串 指 令 ， 我 们 将 在 D.4 节 中 描述 。 在 3.21.3 节 中 有 一 个 在 IO 设备 和 内 存 间 进行 双 
字 块 传送 时 重复 串 指令 操作 的 例子 。 在 3.23.3 节 、11.3.6 节 、11.3.7 节 中 描述 的 SIMD 流 扩展 (SSE) 
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指令 也 可 以 用 这 个 组 中 的 字 节 码 表示 。 

有 两 个 组 ， 其 中 每 组 只 包含 一 个 字 节 码 。 正 如 D.5 节 中 描述 的 ， 这 些 码 用 来 替换 缺 省 操作 数 
大 小 或 缺 省 地 址 大 小 。 

第 4 组 的 前 缀 字 节 用 来 替换 产生 内 存 地 址 的 段 寄 存 器 的 缺 省 选择 值 。 在 11.3.1 节 中 给 出 了 段 寄 
存 器 使 用 的 概括 性 描述 。 


D.4 其 他 指令 


完整 的 IA-32 指 令 集 所 包含 的 指令 远 比 表 D-4 中 列 出 的 多 得 多 。 这 里 简要 描述 了 表 中 没有 包括 
的 4 种 指令 类 型 。 


D.4.1 RHS 


对 于 在 连续 的 存储 单元 中 的 数据 项 提供 了 专门 的 指令 ， 可 以 高 效 地 执行 公共 的 重复 操作 。 这 
些 数据 结构 称 作 为 惠 ， 相 应 的 指令 称 作 串 指令 。 串 中 的 每 一 项 可 以 是 字 节 或 32 位 的 双 字 。 串 指令 
可 以 用 在 将 一 个 串 从 内 存 的 一 个 区 域 传送 到 另 一 个 区 域 的 操作 中 ， 或 者 比较 两 个 串 是 否 相等 。 

我 们 利用 串 传 送 指令 来 说 明 串 指令 是 如 何 执行 的 。 操 作 码 MOVSB 和 MOVSD 用 于 传送 字 节 
和 双 字 。 这 些 指令 与 常规 的 传送 指令 不 同 ， 因 为 它们 只 包含 OP 码 而 没有 明确 的 操作 数 。 这 时 候 
该 指令 假设 源 操作 数 的 地 址 在 寄存 器 ESI 中 ， 目 标 操作 数 的 地 址 在 EDI 中 。MOVSB 的 执行 包括 将 
字 节 从 源 位 置 传送 到 目标 位 置 ， 然 后 递增 ESI 和 EDI 指 针 寄存 器 。 这 个 指令 可 以 放 在 一 个 循环 中 
来 传送 串 的 所 有 字 节 。 还 可 以 选择 一 个 重复 的 前 缀 与 指令 一 起 来 传送 整个 申 。 这 样 ， 除 了 初始 
化 ESI 和 和 EDI 寄存 器 外 ， 还 必须 将 ECX 寄 存 器 初始 化 成 囊 的 长 度 。 每 传送 一 个 字 节 它 的 值 就 会 被 
减 1。 指令 

REP MOVSB 

的 执行 传送 了 一 个 串 的 全 部 字 节 。 这 条 指令 被 取出 一 次 并 且 重 复 执行 操作 直到 寄存 器 ECX 中 的 
数值 减 到 零 为 止 。 

提出 带 重 复 选 择 项 的 串 指令 是 出 于 性 能 的 考虑 。 使 用 下 面 的 循环 指令 可 以 完成 同样 的 工作 

MOV BYTE PTR[EDIJ,[ESI] 


指针 寄存 器 不 断 增加 ， 而 计数 寄存 器 ECX 不 断 减 少 直到 为 0。 但 这 种 方法 的 执行 时 间 会 很 长 。 
D.4.2 浮 点 、MMX 和 和 SSE 指令 


IA-32 指 令 中 的 IEEE 格 式 〈 见 第 6 章 ) 提供 了 浮 点 数据 操作 的 完整 范围 。 图 3-37 中 显示 的 8 个 
浮 点 寄存 器 用 来 保存 这 些 数据 。 除 了 加 、 碱 、 乘 、 除 操作 外 ， 还 提供 了 三 角 函 数 运算 操作 。 

3.23.2 市 中 描述 的 MMX (多 媒体 扩展 ) 指令 ， 用 来 对 存放 于 浮 点 寄存 器 或 内 存 中 的 封装 成 64 
位 的 四 倍 长 字 的 短 整 数 ， 并 行 执行 简单 的 算术 和 多 辑 操作 。 在 图 形 和 信号 处 理应 用 中 需要 这 样 的 
操作 。 

SSE ( 流 SIMD 扩展 ) 指令 首先 在 Pentium 处 理 器 中 使 用 并 在 Pentium 4 中 功能 得 到 强化 ( 见 
11.3.6 节 和 11.3.7 节 )， 该 指令 对 封装 在 8 个 128 位 处 理 器 寄存 器 中 的 浮 点 数 进行 并 行 的 算术 操作 。 
这 些 寄存 器 与 通用 寄存 器 及 浮 点 寄存 器 不 同 。 单 独 的 数据 项 可 以 是 32 位 或 64 位 的 浮 点 数 。SEE 指 
令 对 科学 应 用 中 的 向 量 和 和 托 阵 运算 十 分 有 用 。 在 Pentium 4 增强 版 中 , 操作 数 还 可 以 是 64 位 的 整数 ， 


= 


~J 
° 
+ 
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这 些 数据 类 型 应 用 在 数据 安全 应 用 中 的 加 密 和 解密 操作 中 。 
D.5 16 位 操作 


在 3.16.1 节 和 11.3.2 节 中 提 到 ，IA-32 处 理 器 可 以 执行 在 早期 的 Intel 处 理 器 中 使 用 16 位 地 址 和 数 
据 操作 数 方式 的 程序 ， 以 及 在 本 书 中 描述 过 的 使 用 32 位 地 址 和 数据 操作 数 方式 的 程序 。 这 两 种 方 
式 均 可 以 对 字 节 操作 数 进行 处 理 。 当 在 32 位 操作 方式 下 ， 用 操作 码 中 的 一 位 确定 了 操作 数 是 一 个 
字 节 还 是 一 个 32 位 的 双 字 ; 在 16 位 方式 下 ， 采 用 同样 的 位 来 判断 操作 数 是 一 个 字 节 还 是 一 个 16 位 
字 。 操 作 的 缺 省 方式 由 段 描述 符 中 的 一 位 设 定 。11.3.2 节 对 这 些 描述 符 做 了 简要 的 介绍 。 

在 我 们 的 讨论 中 ,默认 处 理 器 是 在 32 位 缺 省 方式 下 操作 。 但 是 ， 当 指令 是 前 后 相连 的 时 候 ， 
如 果 图 D-1 中 所 示 的 指令 中 的 第 一 个 字 节 使 用 了 前 绥 字 节 ， 那 么 在 该 指令 的 执行 期 间 ， 它 的 缺 省 
方式 将 会 被 忽略 。 缺 省 操作 数 长 度 或 缺 省 地 址 长 度 ， 或 者 这 两 者 一 起 都 会 由 于 不 同 的 前 组 字 节 的 
存在 而 被 忽略 。 


D.6 编程 实验 


使 用 汇编 语言 程序 进行 实验 的 一 个 方便 方式 ， 是 使 用 高 级 语言 提供 的 内 连 (in-line) 汇编 语 
言 工具 。 第 9 章 给 出 了 一 个 在 C 程 序 中 插入 一 段 由 汇编 语言 编写 的 W/O 程序 的 例子 。 这 里 ， 我 们 说 
明 如 何在 C/C++ 中 使 用 内 连 工具 。 微 软 公司 提供 了 一 个 在 由 Intel IA-32 处 理 器 构造 的 个 人 电脑 中 的 
Windows 操 作 系 统 环境 下 运行 的 编译 器 。 

图 D-2 显 示 了 图 3-40a 中 的 加 法 循环 程序 是 如 何 合并 到 一 个 C/C++ 程序 中 的 。 汇 编 语言 指令 码 
缩写 为 结构 

_asmí...) 
C/C++ 程 序 的 开头 做 了 数据 声明 和 初始 化 操作 ， 并 且 执 行 汇 编 语 言 程序 的 结果 ， 即 内 存单 元 SUM 
的 值 ， 由 程序 末 的 输出 语句 打印 出 来 。 

程序 中 没有 给 出 命名 、 打 开源 程序 并 进入 、 编 译 和 执行 的 操作 ， 这 是 因为 它们 在 很 大 程度 上 
随 所 使 用 的 软件 环境 不 同 而 不 同 。 

用 汇编 语言 产生 的 一 个 16 位 机 器 指令 列表 ， 如 图 D-2 中 的 一 个 ， 可 以 由 编译 器 得 出 。 理 解 图 
D-1 中 格式 下 IA-32 指 令 的 二 进 制 编码 的 例子 对 学 习 列表 很 有 帮助 。4 指 令 循 环 的 列表 如 图 D-3。 用 
于 对 每 条 指令 编码 的 字 节 的 16 进 制 表示 在 图 D-3a 的 左边 显示 。 图 中 b 和 ec 部 分 给 出 了 ADD 和 JG 指 令 
的 二 进 制 编码 细节 。 

首先 ， 考 虑 一 下 ADD 指 令 。 在 操作 码 的 右 末 位 置 1 的 两 位 含义 如 下 : 最 后 一 个 1 指明 操作 数 
大 小 是 32 位 的 ; 倒数 第 二 个 1 指明 源 操作 数 是 储存 在 内 存 中 的 操作 数 。 从 表 D-2 中 ， 我 们 可 以 观 
察 到 ModRVM 字 节 的 Mod 字 段 (00) 和 R/M 字 段 (100) 指明 了 内 存 操作 数 使 用 的 是 基 址 变 址 寻 
址 方式 ,而 Reg/OP 码 字段 (000) 指定 EAX 寄存 器 是 目标 寄存 器 。SIB 字 节 的 基 址 字段 (011) 
指明 EBX 为 基 址 寄存 器 ， 并 且 变 址 字段 (111) 指明 EDI 为 变 址 寄存 器 。 等 级 字段 (10) 选择 4 
作为 等 级 参数 。 

在 图 D-3c 中 编码 的 JG 指 令 解 释 如 下 : 操作 码 的 前 4 位 (0111) 指明 了 带 有 一 个 字 节 偏 移 量 的 
条 件 跳 转 ， 最 后 4 位 (1111) 指定 了 “大 于 ”条 件 。 偏 移 量 字 节 中 保存 的 是 - 7 的 补 码 表示 形式 。 
它 是 紧 跟 在 JG 指 令 后 的 指令 地 址 到 循环 开始 处 ADD 指 令 地 址 之 间 的 距离 ， 用 字 节 表示 。 


Intel 14-32 指 合集 
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# include < stdio.h > 
void main(void) 


{ 


long NUMI[5]; 
long SUM; 
long N; 


NUMI[0] = 17; 
NUMI{1] = 3; 
NUMI[2] = —51; 
NUM113] = 242; 
NUM1[4] = 113; 
SUM = 0; 

N = 5; 


-asm { 
EBX,NUM1 
ECX,N 
EAX,0 
EDI0 

STARTADD': EAX.[EBX + EDI*4] 
EDI 
ECX 
STARTADD 
SUM,EAX 

} 


printf ( “The sum of the list values is %ld Nn” ,SUM ); 





图 D-2 图 3-40a 中 的 IA-32 程 序 封装 为 CC++ 程 序 


机 器 指令 (16 进 制 ) 汇编 语言 指令 





STARTADD: ADD EAX,[EBX + EDI*4] 
INC EDI 
DEC ECX 
JG STARTADP 





a) 循环 体 编码 


BB 
00 000 100 10 111 011 


( 见 表 D-2) ( 见 图 D-1c) 





b) ADD 指 令 


图 D-3 图 D-2 中 循环 体 的 编码 





JF F9 
O1111111 111111001 


JG -7 
( 短 偏 移 量 ) 


c) JG 指 令 


图 D-3 (#) 





处 理 器 堆栈 的 使 用 

编译 器 使 用 寄存 器 ESP 和 EBP 分 别 作为 处 理 器 堆栈 指针 和 帧 指针 。 因 此 ， 内 连 式 汇编 语言 程 
序 不 能 将 这 些 寄存 器 用 做 其 他 用 途 。 而 且 ， 编 译 器 分 配 内 存 变 量 ， 如 在 “ 主 ” 程 序 中 声明 的 
NUMI、SUM 和 N 作 为 栈 的 局 部 变量 。 当 它们 用 在 汇编 语言 的 直接 寻 址 方式 中 时 ， 如 图 D-2 中 程序 
的 前 两 条 指令 的 情况 ， 编 译 器 采用 基 址 加 偏 移 量 方式 访问 它们 。 帧 指针 EBP 用 作 基 址 寄存 器 ， 并 
且 压 人 堆栈 的 偏 移 量 是 负 值 ， 即 从 低位 地 址 增长 。 如 果 这 些 变 量 在 “ 主 ” 程 序 之 外 声明 ， 它 们 就 
成 为 全 局 变量 并 可 用 直接 寻 址 方式 来 访问 。 
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字符 编码 与 数 的 转换 


E.1 字符 编码 


计算 机 中 信息 的 存储 和 处 理 涉及 使 用 若干 个 二 进 制 变量 对 信息 的 各 项 进行 编码 的 问题 。 在 二 
进 制 系统 中 正 数 和 负数 表示 的 方法 有 些 不同 。 第 6 章 给 出 了 最 为 常用 的 格式 ， 同 时 还 讨论 了 整数 

对 于 主要 处 理 商 业 数 据 的 计算 机 来 说 ， 最 常用 的 是 表示 和 处 理 十 进 制 的 数 。 表 BE-1 给 出 了 单 
个 数字 最 常用 的 编码 ， 称 为 二 进 制 编码 的 十 进 制 数 (BCD )。 这 种 编码 仅仅 是 4 位 二 进 制 数字 系统 
的 前 10 个 值 (0~9)。 这 样 的 4 位 编码 值 的 串 只 要 使 用 一 个 适当 的 码 作为 符号 位 置 ， 就 可 以 用 来 代 
表 所 需 范围 内 的 任何 正 整数 和 负 整 数 。 

字母 字符 (A~Z)、 操 作 符 、 标 点 符号 、 控 制 符号 (+ 一 /,:; LF CR EOT) 和 数字 必须 被 表示 成 
能 进行 文本 存储 和 编辑 ， 并 适合 高 级 语言 输入 、 处 理 和 输出 操作 的 形式 。 能 达到 这 种 目的 的 两 种 
标准 码 是 ASCIH 码 和 EBCDIC 码 。 标 准 ASCII 码 是 一 个 7 位 码 ，EBCDIC 码 是 一 个 8 位 码 。 表 EB-2 和 表 
E-3 分 别 列 出 了 标准 ASCII 码 和 EBCDIC 码 。 其 中 ASCIH 码 是 目前 最 常用 的 格式 。 

在 许多 应 用 中 比较 偏好 使 用 8 位 数 ; 因此 ， 基 本 的 ASCII 码 通常 被 扩展 为 8 位 。 常 用 的 方法 是 
将 最 高 位 ， 即 第 7 位 设置 为 0。 另 一 个 可 行 的 方法 是 将 第 7 位 作为 编码 字符 的 校 验 位 。 

这 里 有 必要 对 ASCIH 和 EBCDIC 码 的 结构 做 一 些 说 明 。 注 意 在 
两 种 编码 中 十 进 制 码 (0~9) 的 低 4 位 就 是 表 E-1 中 的 BCD 码 。 这 个  #E4 十 进 制 数 的 BCD 码 
特点 简化 了 两 种 操作 。 第 一 ， 可 以 对 表示 为 十 进 制 数字 的 两 个 字符 


I BCD 
Hub. TTEN ERENER Te — 
现 。 当 必须 把 十 进 制 数 按 数字 顺序 存储 时 ， 这 个 操作 是 很 有 用 的 。 ! aot 
第 二 ， 当 一 些 输入 申 中 作为 一 个 单独 的 实体 被 存储 和 处 理 的 表示 十 ”3 oo0ll 
进 制 数 的 连续 7 或 8 位 码 由 前 后 关系 决定 时 ， 应 用 中 有 时 去 掉 每 个 数 。 5 oror 
字 码 最 左边 的 3 或 4 位 ， 并 将 其 表示 成 4 位 BCD 码 串 。 这 个 压缩 (或 5 oil 
称 为 数据 打包 ) 需要 开始 和 结束 分 负 符 ， 但 是 ， 当 考虑 到 所 需 的 存 $ 1000 


1001 


储 空间 时 ， 这 种 做 法 是 很 恰当 的 。 这 也 同样 适用 于 字母 字符 编码 。 
E.2 十 进 制 数 到 二 进 制 数 的 转换 
这 一 节 介 绍 了 如 何 将 一 个 定点 的 十 进 制 数 变 成 等 价 的 二 进 制 形式 。 二 进 制 数 


| B=b,b,-i- bib ib b, 
V 为 B 的 十 进 制 表示 : 
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V (B) =b, x 2" + bs 1x 277? 4t bo x 2? 
+b 1x2-1+hb 2 x2-2+…+b_nx*2 " 





3E-2 7 位 ASCI 码 

位 | 
位 年 位 位 置 654 
3210 000 011 00 Ol 100 10 10 1H 
0000 NUL DLE SPACE 0 @ P / p 
0001 SOH DCI ! 1 A Q a q 
0010 STX DC2 2 B R b r 
0011 ETX DC3 # 3 C S c s 
0100 | EOT DC4 $ 4 D T d t 
0101 :ENQ NAK % 5 E U e u 
0110 | ACK SYN & 6 F v f v 
0111 | BEL ETB 7 G W g w 
1000 BS CAN ( 8 H X h x 
1001 HT EM ) 9 I Y i y 
1010 LF SUB * : J Z j z 
1011 IVT ESC + ; K [ k I 
1100 | FF FS < L | 1 i 
1101 CR GS - = M ] m ) 
1110 | SO RS > N A n ~ 
1111 .SI US / 7 O 一 o DEL 

NUL ZZA SI 移 进 

SOH “” 头 部 开始 DLE 数据 连接 出 口 

SIX 文本 的 开始 DC1-DC4 设备 控制 

ETX ”文本 的 结尾 NAK 非 应 答 

EOT 传输 结束 SYN 同步 空闲 

ENQ 询问 ETB 传送 的 块 结尾 

ACK 应 答 CAN 取消 (数据 错误 ) 

BEL. 监听 信号 EM 媒介 结尾 

BS SUB 专用 序列 

HT ”水平 制 表 符 ESC 出 口 

LF FS 文件 分 陋 符 

VT £t 1 R GS 组 分 肾 符 

FF RS E # + 8 

CR wmw* US 单元 分 隔 符 

SO 移出 DEL 删除 /空闲 


编码 格式 的 位 位 置 = [615|4131211[o| 


将 一 个 定点 的 十 进 制 数 转 换 为 二 进 制 数 时 ， 整 数 部 分 和 小 数 部 分 要 分 别 计算 。 首 先 ， 整 数 部 
分 的 变换 如 下 : 用 2 去 除 整数 部 分 ， 余 数 是 二 进 制 表示 法 中 整数 部 分 的 最 低位 。 商 再 被 2 除 ， 余 数 
是 二 进 制 表示 中 的 次 低位 。 重 复 这 个 过 程 直至 商 为 0 (包括 商 为 0 这 一 步 )。 

第 二 ， 小 数 部 分 用 乘 2 变 换 。 乘 积 的 结果 在 小 数 点 左边 的 0 或 1 用 二 进 制 中 的 一 位 来 表示 。 乘 
积 的 小 数 部 分 再 乘 以 2 ， 得 到 二 进 制 表示 的 下 一 位 。 得 到 的 第 一 位 整数 是 小 数 点 右边 的 第 一 位 ， 
得 到 的 下 一 位 整数 是 小 数 点 后 的 第 二 位 ， 依 次 类 推 。 重 复 此 过 程 直 到 达到 要 求 的 精确 度 为 止 。 

图 E-1 给 出 了 一 个 将 (927.45)io 转换 为 二 进 制 的 例子 。 整 数 部 分 的 转换 总 是 精确 的 ， 但 一 个 精 
确 的 十 进 制 小 数 对 应 的 二 进 制 小 数 未 必 是 精确 的 。 例 如 ， 图 E-1 中 的 小 数 (0.45)io 并 设 有 等 价 的 二 
进 制 精确 值 。 这 从 图 中 可 以 明显 地 看 出 来 。 在 这 种 情况 下 ， 二 进 制 小 数 按 一 定 的 精确 度 标准 取 值 。 
通常 ， 由 /位 小 数 表示 产生 的 最 大 绝对 误差 e 限 制 为 eg&2-“。 当 然 ， 有 些 十 进 制 小 数 有 精确 的 二 进 
制 值 。 例 如 〈0.25)o= (0.01). 


567 


FARDA RHR 


792 





* @ 
$ ， 
— @ * a~r 


Ən 
SY 


Q = 2 > Z x >= Ñ 
= am zZ on O mx 
所 自已 和 四 请 马 严 一 

m > Z RN 
mun E = ° n. = = 
sovou MOC- 


一 X dS 


: @ — c rn *f u O CD— co = 


UIT OIN TON OOM TIOT OIOT 1I00 0001 IIO OHO 100 0110 Iii00 


vLE 


goa 


[oli lele]r]s[o[i] = Zn yqriyin 


X4 
Hir 


FES 
ES is 
HEEE 


sg 


F 72 


SHa 
Taa 
DT 
LH 
dd 
TINN 











{01009378 8-3 举 








568 


转换 (027.45) 


0.40 x = 0.80 


0.80 x} = 1.60 


(B27.45)b = (M110011111.0111001 -W 





图 E-1 十 进 制 数 到 二 进 制 数 的 转换 
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索引 中 的 页 码 为 英文 原 书页 码 ， 与 书 中 边栏 页 码 一 致 。 


A PowerPC, 592 
register (寄存 器 )，49 
Accumulator ( 累加 器 )，40 relative (相对 )，56 
Access time (访问 时 间 ) 68000, 131 
magnetic disk (磁盘 )，347 68020, 583 
main memory ( 主 存储 跨 )，5 Advanced Micro Devices (AMD) (AMD 公 司 )，591 
Adder (加 法 器 ) Alpha instructions (Alpha 指令 ) 596 
BCD (BCD), 405 Alpha processors (Alpha 处 理 器 )}，597 
carry-lookahead (超前 进位 )，374 21064, 597 
circuit (电路 )，370 21164, 597 
full-adder (全 加 器 )，368 21264, 597 
half-adder ( 半 加 器 }，404 Alphanumeric characters (字母 数字 字符 )，33 
propagation delay (传播 延迟 )，371 ASCH (ASCII), 791 
ripple-carry ( 行 波 进位 )，368 EBCDIC (EBCDIC)，792 
Addition (加 法 )，28，368 Altera Excalibur system ( Altera Excalibur 系统 )，547 
carry (进位 ) 28, 368 Amdahl’s law ( Amdahl 定律 )，654 
carry-save (进位 保留 )，385 Analog to digital ( A/D) conversion ( 模 / 数 转换 )，515 
end-around carry (循环 进位 )，409 Annul bit (EA), 491 
floating-point (F), 398 Apple computers (苹果 计算 机 )，5$91，594 
generate function (生成 函数 ) 372 Arbitration (仲裁 )，237 
modular ( 模 )，29 centralized (集中 式 }，237 
overflow (溢出 )，32，369 distributed (分 布 式 )，239 
propagate function (传播 函数 ) 372 Architecture (体系 结构 )，2 
sum (和 )，28，368 Arithmetic and logic unit (ALU) (B REHE), 5 
Addition loop (加 法 循 坏 ) ARM (公司 名 ，Advanced RISC Machine) 
Address 《地 址 ) 5，33 addressing ( hl), 106 
aligned/unaligned (可 对 齐 /不 可 对 齐 )，36 architecture versions (体系 结构 版 本 )}，579 
big-endian (big-endian), 35 assembly language (汇编 诸 言 )，118 
little-endian (1ittle-endian ) 35 condition codes (条 件 码 )，105，117，736 
Address pointer (地 址 指针 ) 51 hard macrocell core (硬件 宏 单元 核 )，S$80 
Address space (地 址 空间 )，33，205 input/output (VO) (输入 /输出 )，121 
Addressing mode ( 寻 址 方式 )，47 instructions (指令 )，113，734-750 
absolute (绝对 )，49 conditional execution (条 件 执 行 )、106 
ARM (公司 名 ，Advanced RISC Machine)，106 operand shifting (操作 数 移 位 )，114，737 
autodecrement (自动 递减 )，57,，69 pseudo-instructions ( 伪 指 令 )，120 
autoincrement (自动 递增 )，57，69 thumb (thumb), 579 


HP3000, 607 interrupts (中 断 )，224 

IA-32, 159, 772 programming experiments (编程 实验 )，750 
immediate (立即 ), 49 register (寄存 器 )，105 

index ( 变 址 )，52 synthesizable core (综合 核 )，580 

indirect (间接 )}，50 ARM CPU cores ( ARM CPU 内 核 )，581 
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ARM720T, 581 
920T, 581 
1020T, 581 
StrongARM SA-110, 581 
ARM processor cores (ARM 处 理 器 内 核 )，580 
ARM7TDMI, 580 
ARM9TDM1 581 
ARMIOTDMI, 581 
Array processor (阵列 处 理 器 )，620 
ASCII code (ASCI 码 )，4，791 
Assembler (汇编 程序 )，58 
two-pass ( 二 这 扫描 )，63 


Assembler directives (commands) ( 汇编 指示 符 (命令 ))， 


60 
Assembly language (WE), 19, 58 

ARM, 118 

generic (通用 )，58 

IA-32, 170 

mnemonics ( 助 记 符 )，58 

notation (标记 )，19，38 

68000, 140 

syntax (语法 )，58 
Associative search ( 相 联 检索 )，318 
Asynchronous bus (异步 总 线 ) 
Asynchronous DRAM (DRAM), 299 
Asynchronous transmission (异步 传输 )，566 
Athlon processor ( Athlon 处 理 器 )，591 
Autovector (自动 向 蔓 )，214 


B 


Bandwidth (带宽 ) 
communication (通信 )，565，$67，569，570 
memory (存储 器 )，304 
Barrier synchronization (屏蔽 邮 步 )，650 
Base register ( 基 址 寄存 器 )，55 
Baseband (基带 )，564 
Baud rate ( 波 特 率 )，564 
Benchmark program (基准 程序 )，17，656 
Big-endian (big-endian), 35 
Binary variable ( 二进制 变 景 )，662 


Binary-coded decimal (BCD) (二 进 制 编码 的 十 进 制 数 )， 


4, 790 
addition (mèk), 405 
packed (打包 )，83 

Bit (位 ), 4, 27 

Bit map (42W), 559 

Bit rate (位 速率 )，564 

Bit-ORing ( 按 位 -或 )，437 

Booth algorithm (Booth 算 法 )，380 
bit-pair recoding ( 位 偶 重 编码 )，384 


skipping over 15〈 跳 过 1 位 )，382 
Booting (引导 )、350 
Branch (转移 )，46 
delay slot (转移 延迟 模 )，470，491 
delayed (延迟 转移 )，470 
folding (ER), 468 
instruction (转移 指令 )，45 
penalty (转移 代价 )，466 
prediction (转移 预测 )，472，491 
target (转移 目标 )，46 
Breakpoint ( 断 点 )，220 
Bridge ( 桥 )，2$9，260，262 
Broadcast (广播 )、633 
Buffer (缓冲 区 ) 
circular ( 环形 )，71，531 
register (寄存 器 )，10 
Bus (总 线 )，9 
arbitration ( 仲裁)，237 
asynchronous ( RÆ), 244 
cycle (H8), 241 
master ( Fë), 237 
propagation delay (传播 延迟 )，241 
scheduling ( 调度) 10, 624 
skew (相位 偏 移 )，245 
synchronous (同步 )，241，264 
timing 〈 时 序 )，242 
Bus standards (总 线 标准 )，259 
ISA, 260 
PCI, 261 
SCSI, 266 
USB, 272 
X3.131 (SCSI), 266 
Byte (6), 33 
Byte addressable ( 按 字 节 寻 址 )，35 


C 


Cache memory ( 高速 缓存 存储 器 )，5，13，294，313- 


329 
in ARM7IOT, 326 
associative mapping ( 相 联 映射 )，318 
block ( 块 )，315 
coherence (--SttE), 321, 641 
direct mapping (直接 映射 )，317 
dirty bit ( 脏 位 )，316，326 
hit (命中 )，316 
hit rate (命中 率 )，332 
levels 《层次 )，313，335 
line ( 块 )，315 
load through (直接 装 人 )，316 
lockup-free (无 锁定 )，337 


di 
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mapping function (映射 功能 )，316 
miss (失效 )}，316 
miss penalty (失效 开销 )，332 
miss rate (失效 率 )，332 
in Pentium Ill, 326 
in Pentium4, 329 
in 68040, 325 
replacement algorithm ( $R), 316, 321 
set-associative mapping (组 相 联 映射 )，318 
snoopy controls 《监听 控制 )，643 
tag (标志 )，318 
valid bit (有 效 位 )，319，326 
write back (In|), 316, 642 
write buffer ( BtRahK ), 335 
write through ( H4% 75), 316, 642 
Carry (进位 )，28，368 
flag (标志 ) 
Cartridge tape (AAEH), 359 
Cathode-ray tube (CRT) (阴极 发 光 管 )，558 
CC-NUMA systems (CC-NUMA 系 统 )，645 
CD-ROM (只 读 光 盘 ),，5，355 
Character codes (字符 码 )，33 
ASCI, 791 
EBCDIC, 792 
Character string (字符 电 )，36 
Charge-coupled device (CCD) (HARAR), 557 
Circuit switching (线路 交换 )，635 
Circular buffer (queue) ( 坏 形 缓冲 区 (EA30)), 533 
CISC (Complex Instruction Set Computer) (CISC (4 
杂 指 令 集 计 算 机 ))，17，97 
Clock (时 钟 )，14 
cycle (周期 )，14 
rate (速率 )，16 
Clock recovery (时 钟 复 位 )，565 
Coherence (一 致 性 ) 
Combinational circuits (组 合 电路 )，691 
Compiler (编译 程序 ， 编 译 器 )，4，11 
optimizing (优化 编译 器 )，17 
Complement ( 补 码 )，665 
Complementary metal-oxide semiconductor (CMOS ) 
(互补 金属 氧化 物 半 导体 )，681 
Complex Instruction Set Computer (复杂 指令 集 计算 机 》 
Complex programmable logic device (CPLD) (复杂 可 编 
程 逻 辑 器 件 )，711 
Computer (计算 机 )，2 
Computer-aided design (CAD) (计算 机 辅助 设计 )，677 
Concurrency (并 发 性 )，15 
Condition code register ( 条 件 码 寄存 器 ) 46 
Condition codes 《条 件 码 )，46，84 
ARM, 105, 117, 736 
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IA-32, 156, 171, 783 

side effect (副作用 )、478 

68000, 141, 768 
Conditional branch (条件 转 移 ) 46 
Context switch ( 上下文 切换 )，223 
Control store 《控制 存储 器 }，430 
Control unit (控制 单元 ), 6 
Control word (控制 字 )，430 
Coprocessor ( HEB g$ ) 

ARM instructions (ARM 指 令 )，75S0 
Counter ( 计数 器 ) 

ripple 〈 行 波 )，702 

Synchronous (同步 )，703，714 
Critical section (临界 区 )，640 
Crossbar (纵横 )，625 
Cycle stealing (周期 挪用 ) ，237 
Cyclic redundancy check (CRC) ( 循 坏 元 余 校 验 ) 279 


D 


Daisy chain (菊花 链 ) 216 
Data (数据 )，4 
Data communication equipment (数据 通信 设备 )，、564 
Data striping (数据 条 带 化 )，351 
Data terminal equipment (数据 终端 设备 )，564 
Data types (数据 类 型 ) 

bit (位 )，27 

byte ( 字 节 )，33 

character ( FF), 33 

floating-point (TF), 394 

fraction (小 数 )，394 

integer ( 整 型 ， 整 数 )，27 

string (##), 36 

word (F), 33 
Datapath (数字 通路 ) 414 
De Morgan's rule ( 德 摩根 律 )，670 
Debouncing (反弹 )，249 
Debugging (Wik). 63, 219 
Decoder ( 译 码 器 )，703 
Demodulation ( 解 调 )，564 
Desktop computer ( 台式 机 )，2 
Device driver (REKA), 223 
Differential signaling (微分 信号 )，308 
Digit packing (数字 打包 ) 
Digital camera (数码 照相 机 )，514 
Digital subscriber loop (DSL) (数字 式 用 户 环 路 ) ，569 
Direct memory access ( 直接 存储 器 访问 ) 
Directory-based cache coherence (基于 目录 的 高 速 缓存 
一 致 性 )，643 
Dirty bit (IEZ) 
Disk ( 盘 ) 
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Disk array (磁盘 阵列 )，351 
Dispatch operation (调度 操作 )，467，486 
Dispatch unit (调度 部 件 ) 
Display buffer ( 显示 缓冲 区 ) 559 
Displays (显示 器 )，558 
Distributed computer system (分 布 式 计算 机 系统 )，618 
Distributed computing (分 布 式 计算 )，21 
Distributed memory system (分 布 式 存储 器 系统 )，623 
Division (除法 )，390 
floating-point (YFA), 398 
nonrestoring《 不 恢复 )，391 
restoring (K4), 391 
DMA (Direct Memory Access) (直接 存储 器 访问 )，235 
block (burst) mode (k (脉冲 ) 模式 )，237 
controller (控制 器 )，235 
Don't-care condition (无 关 项 条 件 )，674 
Dot product (点 积 ) 
DVD (数字 多 功能 光盘 )，357 
Dynamic memory (DRAM) (动态 存储 跨 (DRAM ) )， 
299 


E 


Echoback (J|), 207 
Edge-triggered flip-flop (边沿 触发 触发 器 )，694 
Effective address (有 效 地 址 )，50 
Effective throughput ( 有 效 吞 吐 量 )，624 
Elapsed time (消耗 时 间 )，13 
Embedded processor (嵌入 式 处 理 器 )，517 
Embedded system (嵌入 式 系统 )，5$12 
Emulation (仿真 )，445 
Enterprise system (企业 系统 )，2 
Ethernet ( 以太 网 )，646 
Exception ( 异常 ) 

floating-point (FF), 397 

imprecise (不 精确 )，484 

precise (精确 的 )，485 
Execution phase (执行 阶段 )，413 
Eye pattern (有 眼 孔 图 )，568 


F 


Fan-in (A), 687 

Fan-out ( RH), 687 

Fat-tree network 〔( 胖 树 网 络 )，631 

Fetch phase( 取 指令 阶段 )，413 

Field-programmable gate array (FPGA) (现场 可 编程 门 
阵列 ) 547, 212 

FIFO (first-in, first-out) queue (FIFO (先入 先 出 ) BA 
列 ) 71, 531 

File (文件 ), 11 


File mark (文件 标记 )， 358 
File server (文件 服务 器 )，2 
Finite state machine (有 限 状 态 机 )，719 
Flash memory (内 存 )，312 
Flat panel display (平面 显示 器 )，560 
Flip-fiops (触发 器 )，690-699 
D (DD 触发 器 )，694-697 
edge-triggered (边沿 触发 )，694 
gated latch ( 门 控 锁 存 器 )，690 
JK (下 触发 器 )，697 
latch ( 锁 存 器 )，690 
master-slave ( 主 从 )，694 
SR latch (SR 锁 存 器 )，690 
T (〈T 触 发 器 )，697 
Flit (flit), 634 
Floating point ( 浮 点 ) 393 
addition-subtraction unit 〈 加 法 / 减 东部 件 )，400 
arithmetic operation (算术 运算 )，398 
chopping (截断 )，399 
coprocessor( 协 处 理 器 )，588，750 
double precision( 双 精度 )，396 
exception (异常 )，397 
exponent (指数 )，394 
excess-x representation ( 余 x 表 示 )，396 
format (格式 )，395 
guard bits (保护 位 )，399 
IEEE standard (IEEE 标 准 )，394 
mantissa (尾数 )，394 
normalization (规格 化 )，394 
overflow (RIH), 396 
representation (#7), 395 
rounding (A), 399 
scale factor (比例 因子 )，394 
significant digits 《有 效 数字 )，394 
single precision ( 单 精度 )，396 
special values (特殊 值 )，397 
denormal ( 非 规 格 化 )，397 
Not a Number (NaN) ( 非 数 ， 无 定义 数 )，397 
sticky bit (粘着 位 )，400 
truncation (截取 )，399 
biased/unbiased (有 偏 / 无 偏 )，399 
underflow ( Fi), 396 
Floppy disk (#k#t), 350 
Four-wire link (四 线 连 接 )，565 
Frame pointer (结构 指针 )，77 
Frequency-shift keying (FSK) ( 移 频 键 控 )，564 
Full-duplex (FDX) link (WT. (FDX) i£8), 565 
Fully-connected network (全 连接 网 )，625 
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G dispatch (调度 )，467，486 
fetch phase ( 取 指 令 阶 段 )，413 

Gated latch ( 门 控 锁 存 器 )，690 fields ( 域 ,字段 )，62，95 
General-purpose register ( 8 178 4F2s), 8 grouping (分 组 )，496 
Global address space (全 局 地 址 空间 )，637 hazards (阻塞 )，504 
GPU (Graphics Processing Unit) (图 形 处 理 单元 )，561 operands (操作 数 )，39 
Graphics (图 形 ) privileged (特权 )，220，343 

accelerator ( 加速 卡 )，561 queue (队列 )，467 

port (端口 )，562 reordering 〈 重 排序 ) 471 

processing unit ( 处理 单 元 )，561 retired (释放 )，485 
Gray code (Gray 码 )，726 side effects (副作用 )，478 


synthetic (综合 }，489 


H Instruction encoding (指令 编码 )，94 
Instruction fi t y 
Half-duplex (HDX) link ( 半 双 工 连接 )，565 “RM 1 forma, (ESRA) . 
k F), 244 
Handshake (HF) HP3000, 606 


H > 2 
ardware ( 便 件 ) IA-32, 168, 770, 771 
Hardwired contro! (硬件 控制 )，425 
IA-64, 598 

Hertz (#24), 14 add ( 单 地 址 )，40 
Hexadecimal (十 六 进 制 ) 8000 "137 ú 
High-level language (881822), 4, 11, 26 th dr s (三 地 址 )，39 
Hold time (保持 时 间 )，697 的 


two-address (两 地 址 )，39 
at (学 址 )，607 zero-address ( 零 地 址 )，42 
. . Instruction register (IR) (指令 寄存 器 )，7，43、412 
instructions 《指令 )，606 Instruction set architecture (ISA) (指令 集体 系 结构 ) 
stack structure (〈 栈 结构 )，604 26 人 
Hybrid (混合 器 )，566 . . 
Hypercube network 〈 超 立方 体 网 络 )，628 Instruction unit (指令 部 件 )，3 
Instructions ( 指 今 ) 
| arithmetic (Æ), 7, 38, 70 
branch (44 £), 45 
Index register ( 变 址 寄存 器 )}，52 data transfer (数据 传送 )，38 
Input unit (输入 设备 )，4 input/output (输入 /输出 )，56 
Input/output (1/0) (输入 /输出 ) logic (248), 81 
address space (地 址 空间 ) 205 shift and rotate〈 移 位 和 循环 移 位 )，82 
instructions in IA-32 (IA-32 的 指令 )，175 subroutine ( 子 程序 )，、72 
interface circuit 《接口 电路 )，206，248，259 Integrated circuit (IC) ( 集成 电路 )，16，20，688 
memory-mapped (存储 器 映射 )，66，204 Intel 1A-32 Pentium (Intel IA-32 Pentium ) 
program-controlled (程序 控制 )，64 ，207 addressing modes (HEF), 159, 772 
register (寄存 器 )，206 assembly language (汇编 语言 )，170 
status flag (状态 标志 )，67，206 condition codes (条 件 码 )，156，171，783 
unit (XF), 3 input/output (1/0) (输入 /输出 )，174 
Input/output device (输入 /输出 设备 ) block transfers ( 块 传送 }，176 
Input/output port (输入 /输出 端口 )，248 isolated (独立 )，175 
bidirectional (双向 )，254 memory-mapped (存储 器 映射 )，174 
parallel (并 行 )，248, 518 instructions (指令 )，164、171，182，773-784 
serial (47), 257, 521 encoding (8888), 770, 771 
Instruction (指令 )，3，37 format (#34), 168, 770, 771 
commitment (22), 485 multimedia (MMX) (多 媒体 扩展 )，183 
encoding (编码 )，94 string ($), 176, 783 


execution phase (执行 阶段 )，413 vector SIMD (SSE) (向 量 SIMD 扩 展 )，184 
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interrupts (中 斯 )，231-234 
memory segmentation (存储 器 分 段 })，586 
protected mode (保护 模式 )，587 
real mode { 实 模 式 )，586 
segment registers ( 段 湖 存 器 )，156，586 
programming experiments (编程 实验 )，785 
register structure 《寄存 器 结构 )，156 
sixteen-bit mode (16 位 模式 )，588，785 
subroutines ( 子 程序 )，177 
stack frame ( 栈 结 构 )，179 
Intel IA-64 
instructions (指令 )，598 
bundles ( 包 )}，598 
conditional execution 《条 件 执行 })，598 
Itanium processor (Itanium 处 理 器 )，602 
register rotation (寄存 器 循 坏 )，602 
register stack (寄存 器 堆栈 )，600 
register windows (寄存 器 窗口 )，602 
speculative loads ( 推测 性 装 入 )，600 
Intel processors (Intel 处 理 器 ) 
8051, 542 
8086, 585 
8088, 585 
80286, 585 
80386, 588 
80486, 588 
Itanium, 602 
Pentium, 589 
Pentium II, 590 
Pentium III, 590 
Pentium 4, 590 
Pentium pro, 589 
Intellectual property (IP) ( 知识 产权 )，547 
Intellimouse 〈 智 能 鼠标 )，5$55 
Interconnection network (互连网 络 )，622-636 
crossbar (纵横 交叉 )，625 
fat tree ( 胖 树 )，631 
hypercube 〈 超 立方 体 )，628 
mesh (网 状 )，630 
multistage (多 段 )，626 
ring( 坏 状 )，631 
shuffle network〔( 混 洗 网 )，627 
single-bus ( 单 总 线 )，624 
tree( 树 状 )，630 
torus ( 贺 环 形 )，630 
jnterleaving (交叉 )，330 
internet (Internet), 2 
Interrupt (中 断 )，9 
acknowledge (HAA), 214 
in ARM, 224-229 


disabling (禁止 )，212 

edge-triggered (边沿 触发 )，229，212 

enabling ( 允许)，212 

in IA-32, 231-234 

latency ( 等待) 210 

mask (EH), 224 

nesting (E), 213 

nonmaskable (不 可 屏蔽 )，229 

priority (优先 级 ) 215 

service routine 《服务 程序 )})，9 

in 68000, 229-231 

software (软件 )，220 

vectored (IJ ËL), 214 
IR (instruction register) (指令 寄存 器 ), 7, 43, 412 
ISA (instruction set architecture) (指令 集体 系 结构 )， 
26 
Isochronous ( FF), 273, 281 
Itanium processor ( Itanium 处 理 器 ) ，602 


J 


Joystick (操作 杆 )，556 
JTAG port (JTAGEET1), 712 


K 


Karnaugh map ( 卡 诺 图 )，671 
Keyboard (键盘 )，554 


L 


Laser printer (激光 打印 机 )，560 
Latch ( 锁 存 器 )，690 
LIFO (last-in, first-out) (后 进 先 出 )，68 
Link register (链接 寄存 器 )，72 
Linked list (链表 )，、90 
insertion/deletion (插入 /删除 ) 
Liquid crystal display (液晶 显示 器 )，559 
Little-endian (little-endian), 35 
Load through (直接 装 和 人 ) 
Loader (装载 程序 ) ，63 
Load-store multiple operands (Load-store 多 操作 数 ) 
ARM，112 
IA-32, 783 
68000, 146 
Local area networks (LAN) 【局 域 网 络 ) 646 
Ethernet (LAKI), 646 
token ring ( 令 牌 坏 )，647 
Locality of reference (引用 局 部 性 )，315 
Lock ( 锁 )，640 
Logic circuits (逻辑 电路 )，662-724 
Logic families (PHRA) 
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CMOS, 681 
Logic function (逻辑 函数 )，662-677 
AND (j), 664 
EXCLUSIVE-OR (XOR) ($), 664 
minimization (最 小 化 )，668 
NAND (与 非 )，674 
NOR (或 非 )，674 
NOT ( 非 )，665 
OR (或 )，662 
synthesis (组 合 )，664 
Logic gates (逻辑 门 )，662 
fan-in《〈 扇 人 )，687 
fan-out (BH), 687 
noise margin (噪声 容 限 )，686 
propagation delay (传播 延迟 ) 686 
threshold ( 辣 值 )，678，684 
transfer characteristic (传输 特性 )，684 
transition time (转换 时 间 }，686 
Logical address (逻辑 地 址 )，294，338 
Long-haul networks (远程 网 )，646 
Loop (#3) 
with branch prediction ( 带 转移 预测 )，473，492 
with delayed branch ( 带 延 迟 转移 ) 470, 492 
Loosely coupled multicomputer (松散 耦合 多 计算 机 ) ， 
645 
LRU (least-recently used) replacement (最 近 最 少 使 用 
$i), 321 
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Machine instruction (机 器 指令 )，3，94 
Machine language (机 器 语言 ), 4, 19, 26 
Magnetic disk 《磁盘 )，5，344-352 
access time (访问 时 间 ， 存 取 时 间 )，347 
controller (控制 器 )，348 
data buffer/cache (数据 缓冲 区 /高 速 缓存 )，348 
data encoding 〈 数 据 编码 )，344 
drive (驱动 器 ) 346 
floppy disk (软盘 )，350 
latency (等 待 )，347 
organization (组 织 结构 )，346 
rotational delay (旋转 延迟 )，347 
seek time 〈 寻 道 时 间 )，347 
Winchester ( 温 切 斯 特 ) 345 
Magnetic tape (磁带 )，358 
cartridge (RAWH), 359 
format (格式 化 )，358 
Mailbox memory (邮箱 式 存 储 器 ) 659 
Mainframe (主机 )，2 
Manchester code ( 曼彻斯特 码 )，344 
Master-slave ( 主 从 ) 
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Mechanical computing devices (机 械 计算 设备 )，19 
Memory (存储 器 )，4 
access time (访问 时 间 )，5，294 
address ($h), 5, 33 
address register (MAR) (地 址 寄存 器 )，8，293 
address space (地 址 空间 )，292 
asynchronous DRAM (异步 DRAM)，299 
bandwidth (带宽 )，304 
bit line (位 线 )，295 
byte addressable ( 按 字 节 寻 址 )，35 
cache (高 速 缓存 ) 
cell (单元 )，298，310 
controller (控制 器 )，307 
cycle time (周期 时 间 )，294 
data register (MDR) (数据 寄存 器 )，8，293 
DDR SDRAM，304 
DIMM, 306 
dynamic (DRAM) (动态 RAM)，299 
fast page mode (快速 页 模式 )，301 
hierarchy (层次 结构 )，5，313 
interleaving (22 Z), 330 
latency (延迟 )，304 
main (主要 的 ), 5, 13，313 
multiple module (多 模块 )，330 
Rambus (Rambus), 308 
random-access memory (RAM) (随机 访问 存储 器 )，5， 
294 
read cycle ( 读 周 期 )，9 
read-only memory (ROM) (只 读 存 储 器 )，310 
refreshing ( 剧 新 )，301，308 
RIMM, 309 
SIMM, 306 
static (SRAM) (静态 随机 存储 器 )，297，305 
synchronous DRAM (SDRAM) (同步 动态 随机 存储 器 )， 
302 ` 
unit (部 件 )，4 
word (F), 5, 33 
word length (ZK), 33, 292 
word line ( 字 线 )，295 
write cycle ( 写 周 期 )，9 


Memory management unit (MMU) (存储 器 管理 部 件 )， 
294, 339 


in ARM. 581 

in 680X0, 584 

in 80X86, 586 
Memory pages (存储 器 页 )，133 
Memory segmentation (存储 器 分 段 )，586 
Memory-mapped I/O (存储 器 映射 IO)，66，204 
Mesh network 〈 网 状 网 络 ) 630 
Message-passing ( 消息 传递 ) 19, 645, 651 
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protocol (协议 )，623 
MFLOPS measure (MFLOPS 度 量 }，656 
Microcontroller ( 微 控 制 器 )，512，518-521，541 
ARM. 543 
Intel, 542 
Motorola, 542 
Microinstruction ( 微 指令 )，430 
fields( 域 /字段 )，433 
horizontal ( 横向 )，434 
sequencing (Mi), 437, 440 
vertical ( 纵 问 )，434 
Microoperation ( 微 操作 )，433 
Microprogram counter ( 微 程序 计数 器 )，430 
Microprogram memory ( 微 程序 存储 器 ) 
Microprogrammed control ( 微 程 序 控制 )、429 
Microroutine ( 微 程 度 ) 430 
Microwave oven (微波 炉 )，512 
MIMD system (多 指令 流 多 数据 流 系统 )，620 
Miss (失效 ) 
Mnemonic ( 助 记 符 )，58 
Modem ( 调制 解 调 器 )，564 
cable (电缆 )，569 
Modulation (调制 )，564 
Motherboard ( 母 板 )，259，305 
Motorola processors (Motorola 处 理 器 ) 
ColdFire family (ColdFire 系 列 )，585 
ColdFire MCFSxxx (ColdFire MCF5xxx), 543 
68000，130 
68020, 582 
68030, 584 
68040, 584 
68060, 585 
68HC11, 542 
683xx, 543 
Motorola 68000, 130 
addressing modes ( hly), 131, 752 
assembly language (汇编 语言 )，140 
condition codes (条 件 码 )、141，768 
input/output (VO) (输入 /输出 )，145 


instruction set (指令 集 )，136，141，151，754-767 


interrupts ( 中断)，229-231 
register structure (寄存 器 结构 )，131 
subroutines ( 子 程序 )，146 
Mouse (鼠标 ) 555 
Multicast ( 多 播 )，633 
Multicomputer ( 多 计算 机 ) ，18，638，645 
Multiple issue ( 多 发 操作 )，482 
Multiplexer ( 多 路 复 用 器 )，705 
Multiplication (乘法 )，376 
array implementation 【阵列 实现 )，376 


Booth algorithm (Booth 算 法 )，380 
carry-save addition (进位 保留 加 法 )，385 
fast (快速 )，383 
floating-point (FFA), 398 
sequential implementation (顺序 实现 )，378 
signed-operand ( 有 符号 操作 数 ) 380 
Multiprocessor (多 处 理 器 )，18，618、622 
cache coherence (高 速 缓存 一 致 性 )，641 
caches (高 速 缓存 ) 637 
global memory (全 局 存储 器 ) 623 
interconnection network (互连网 络 )，624-636 
local memory (局 部 存储 器 )，623 
private address space (私有 地 址 空间 ) ，638 
program parallelism 〈 程 序 并 行 性 )，638 
shared memory (共享 存储 器 )，18，637 
shared variables (共享 变量 )，640 
speedup ( 加速)，653 
Multiprogramming (多 道 程序 )，12 
Multistage network ( 多段 网 络 )，626 
Multitasking (多 任务 )，12，221 


N 


Network of workstations (工作 站 网 络 )，647 
Noise (噪声 )，686 
Noise margin (1R ARR), 686 
Nonblocking switch (无 阻塞 交换 )，626 
Notebook computer (笔记 本 电脑 )，2 
NUMA multiprocessors (NUMA 多 处 理 机 )，623 
Number conversion (数字 转换 )，793 
Number representation ( 数 的 表示 ) 

floating-point (77A), 394 

hexadecimal (十 六 进 制 )，64 

1's-complement ( 反 码 }，27 

sign and magnitude ( 原 码 )，27 

signed integer (有 符号 整数 )，28 

temary 《三 进 制 )，404 

2’s-complement ( 补 码 )，27 


O 


Object program (目标 程序 )，4，58 
1°s-complement representation ( 反 码 表示 )，、27 
OP code (操作 码 )，59，95 

in ARM, 106 

in LA-32, 168 

in 68000, 135 
Open-drain (WEIER), 211 
OpenGL (开放 式 图 形 库 )，563 
Operand forwarding (操作 数 传 递 )，462 
Operand (操作 数 )，26 
Operating system (操作 系统 )，11 
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multitasking (多 任务 )，221 
process (进程 )，221 
scheduling (调度 )，221 
Optical disk ( 8), 5, 352-358 
CD-Recordable ( 可 刻录 CD )，356 
CD-Rewritable ( 可 按 写 CD)，356 
CD-ROM (只 读 光 盘 )，355 
DVD (数字 多 功能 光盘 )，357 
Output unit (输出 设备 ) 6 
Overflow (溢出 )，32，84 
flag (标志 ) 


Packet ( 包 )，624 
Page (页 )，339 . 
Parallel I/O port ( 3Ë4T1/OS8 1 ), 248, 518 
Parallel processing ( 并 行 处 理 ) 619 
Parameter passing (参数 传递 ) 74 
by reference ( 按 地 址 ) ，75 
by value ( 按 值 )，75 
Parity (奇偶 校 验 )，567 
PC (程序 计数 器 ) 
Performance (性 能 )，13 
basic equation (基本 公式 )，14 
execution time (执行 时 间 )，13 
measurement ( 视 贡 )，17，656 
memory (存储 器 )，329 
multiprocessors ( 多 处 理 器 )，653 
pipeline (流水 线 )，503-505 
processor (处 理 器 )，13 
Peripheral device ( 外围 设备 )，554 
Personal computer (个 人 计算 机 )，2 
Phase encoding (相位 编码 )，344 
Phase-shift keying (PSK) ( 移 相 键 控 )，564 
Physical address (物理 地 址 )，338 
Pipelining (流水 线 )，15，454 
addressing modes ( 寻 址 方式 )，465,476 
basic concepts {基本 概念 )，454 
branching ( 转移) ，466 
bubbles (气泡 )，460 
condition codes (条 御 码 )}，465，478 
data hazards (数据 阻塞)，459，461 
instruction hazards (指令 阻塞 )，459，465 
performance (PERE), 503 
stalling (拖延 )，459 
structural hazard (结构 阻塞 )，460 
Pixel (像素 )，558 
Plasma display (等 离子 显示 器 }，560 
Piug-and-piay ( 即 播 即 用 )，261，265，274 
Pointer register ( 指针 寄存 器 ) 51 
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Polling (46i), 207, 213 
Pop operation 《出 栈 操作 ) 
Port (端口 ) 
PowerPC 
addressing modes ( 妇 址 方式 )，592 
instructions (指令 )，592 
registers (寄存 器 )，591 
PowerPC processors (PowerPC 处 理 器 ) 
Prefetching ( 预 取 )，336 
Primary storage ( 主 存储 器 )，5 
Printer (打印 机 )，6，560 
Priority (优先 级 ) 215 
Private memory (私有 存储 器 ) ，623 
Privileged instruction (特权 指令 )，220，343 
Process (进程 ) 
Processor (处理 器 )，3 
Processor stack (处 理 器 堆栈 )，73 
Processor status word (PSW) (处 理 器 状态 字 )，46 
in ARM，224 
in IA-32, 232 
in 68000, 230 
Processor time ( 处 理 器 时 间 )，13 
Program (程序 )，4 
Program counter (PC) (程序 计数 器 )，8，43 ，412 
Program examples (程序 示例 ) 
addition loop ( 加 法 循环 ) 
ARM, 118 
generic (通用)},，45，51，57 
IA-32, 166 
68000, 143 
character transfer (字符 传送 ) 525 
circular buffer (环形 缓冲 区 )，531 
digit packing 〈 数 字 打 包 ) 
ARM，116 
generic (通用 )，82 
IA-32, 174 
68000, 151 
dot product (点 积 ) 
ARM, 126 
generic, 86 
IA-32, 184 
68000, 152 


message-passing multiprocessor (消息 传递 多 处 理 


器 )，651 


shared-memory multiprocessor (共享 存储 器 多 处 


理 器 )，648 
input/output (输入 /输出 ) 
ARM, 121 
generic, 67, 207 
IA-32, 175 
68000, 145 
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interrupt service routine ( 中断 服务 程序 ) 
ARM, 230 
generic, 219 
TA-32, 234 
68000, 232 
tinked-list insertionfdeietion〈 链 表 插 人 /删除 ) 
ARM, 127 
generic, 92, 93 
IA-32, 185 
68000, 154 
reaction timer (反应 计时 器 )，5S37 
sorting (排序 ) 
ARM, 127 
generic, 87 
JA-32, 185 
68000, 153 
subroutines ( +Ë) 
ARM, 122 
generic, 74, 76, 79 
IA-32, 177 
68000, 146 
Program parallelism (程序 并 行 性 )，638 
shared variables (共享 变量 )，640 
Program state (程序 状态 ) 221 
Program-controlled I/O (程序 控制 IO ) 
Programmable array logic (PAL) (可 编程 阵列 逻辑 )， 
710 


Programmable logic array (PLA) (可 编程 逻辑 阵列 )， 
707 
Programming experiments (编程 实验 ) 
in ARM, 750 
in IA-32, 785 
Propagation delay (传播 延迟 ) 
Protected mode (保护 模式 )，587 
Protection (保护 )，343 
Push operation ( 进 栈 操作 ) 


Q 


Quadrature amplitude modulation (QAM) ( 正 交 调幅 )， 
564 


Queue (队列 ), 71 
R 


RAID disk systems (RAID 磁 盘 系统 )，351 

Rambus memory (Rambus 存 储 器 )，308 
Random-access memory (RAM) (随机 访问 存储 器 )，5 
Raster scan (光栅 扫描 )，558 

Reaction timer (反应 计时 器 )，635 

Reactive system (反应 系统 )，541 


Read-modify-write ( 读 - 修 改 - 写 ) ，640 
Read-only memory (ROM) (只 读 存 储 器 )，310 
electrically erasable (EEPROM) ( 电 可 擦 除 可 编程 只 读 
存储 器 )，311 
erasable (EPROM) (可 擦 除 可 编程 只 读 存储 器 }，311 
flash (内存 }，312 
programmable (PROM) (可 编程 只 读 存储 器 )，311 
Real mode ( 实 模式 )，586 
Real-time processing (实时 处 理 )，210，535 
Reduced Instruction Set Computer (精简 指令 集 计算 机 ) 
Refreshing 《出 新 ) 
Register (寄存 器 )，6，699 
base ( 基 址 )，55 
general-purpose (通用 )，8 
index (HE), 52 
port (端口 )，423 
renaming ( 重 命名 )，485，498 
windows (窗口 )，488 
Register transfer notation (RTN) (寄存 器 传送 标记 )， 
37 
Rendering (%2), 562 
Reorder buffer (重新 排序 缓冲 器 )，485 
Repiacement algorithm ( 置换 算法 ) 321 
Ring network ( 环 状 网 络 )，631 
RISC (Reduced Instruction Set Computer) (精简 指令 集 
计算 机 ) 17, 97, 578 
Rounding (A ) 


S 


Scalability (可 伸缩 性 ) 633 
Scaler ( 定 标 器 ) 702 
Scanner (扫描 仪 )，557 
Scheduling (调度 ) 
SCI Standard (SCI 标 准 )，644 
SCSI bus (SCSI 总 线 ) 
Secondary cache (二 级 高 速 缓 存 )，314 
Secondary storage (辅助 存储 器) 5, 344-359 
Segmentation (分 段 ) 
Sequential circuits (时 序 电 路 ) 691, 714-723 
finite state machine (有 限 状 态 机 )，719 
state assignment (状态 分 配 )，716 
state diagram (状态 图 )，715 
state table (状态 表 ), 716 
synchronous (同步 ), 718 
Serial IO interface ( 47O% 0), 257, 521 
Serial transmission ( 串 行 传输 )，563 
Server (服务 器 )，2，512 
Setup time (建立 时 间 )、242，697 
Seven-segment display ( 七 段 显 示 器 ) 704 
Shared memory (共享 存储 器 ) 18, 637, 648 
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Shared variables (共享 变量 ) ，640 
busy-waiting (人 忙 等 待 )，658 
critical section 《临界 区 )}，640 
locks (##), 640 
read-modify write access ( 读 -修改 - 写 访 问 )，640 
Test-and-Set instruction (测试 - 蚁 位 指令 )，640 
Shift register 〈 移 位 寄存 器 ) 700 
Shuffle network ( 混 洗 网 ) 627 
Side effects ( 副作用) 
Sign bit (符号 位 )，27，34 
Sign extension (符号 扩展 )，32 
SIMD system ( 单 指令 流 多 数据 流 系统 )，620 
Simplex link ( 单 工 连接 ) 565 
Simulated annealing (模拟 退火 )，655 
SISD system ( 单 指令 流 单数 据 流 系统 )，619 
Skew { 偏 斜 ) 
Small-scale integration (SSI) (小 规模 集成 SSI) ，689 
Snoopy cache (监听 高 速 缓存 ) 643 
Soft processor core( 软 处 理 器 核 }，547 
Software interrupts (软件 由 断 ) 
Sorting 《排序 ) 
Source program (流程 序 )，4，58 
SP (堆栈 指针 ) 
SPMD application (SPMD 应 用 )，651 
SPEC rating (SPEC 等 级 )，18 
Speedup ( 加速) ，653 
Split-transaction protocol (分 割 事务 协议 )，624 
Stack ($R, HERR). 63 
in ARM, 122 
frame (结构 ) 
ARM, 123 
generic, 75 
IA-32, 179 
IA-64, 600 
68000, 146 
frame pointer (FP) (结构 指针 FP)，77 
in HP3000, 604 
in IA-32, 177 
in IA-64, 
pointer (SP) (指针 SP)，68 
processor (处 理 器 ) 
push and pop operations ( 进 栈 和 出 栈 操作 )，68 
pushdown ( FHE), 68 
in 68000, 146 
in subroutines (在 子 程序 中 )，73 
Standards (标准 ) 
IEEE floating-point (IEEE 浮 点 )，395 
IEEE-802, 646 
RS-232-C, 571 
SCI, 644 


579 


Start-stop format (起 止 方式 )，566 
State diagram (状态 图 )，715 
State table (状态 表 )，716 
Static memory (SRAM) (静态 存储 器 )，297，305 
Status flag (状态 标志 ) 
Status register ( 状态 寄存 跨 ) 
Store-and-forward network (存储 -转发 网 络 )，634 
Stored program (存储 程序 )，4 
Strobe 〈 选 通 )，241 
Subroutine ( 子 程序 )，72 

in ARM, 122 

in IA-32, 177 

in IA-64, 600 

linkage (链接 )，72 

nesting (IK), 73, 78 

parameter passing (参数 传递 ) 74 

in 68000, 146 
Subtraction 《了 减法) 29 

floating-point ( 浮 点 )，398 
Sum-of-products form ( 积 之 和 形式 )，667 
Sun Microsystems processors 

microSPARC, 595 

SPARC, 594 

UltraSPARC I, II, II, 493, 595 

visual instruction set ( VIS) (可 视 化 指令 集 )， 
595 

Supercomputer (巨型 计算 机 )，2，618 
Superscalar processor (超标 量 处 理 器 )，1$，481 
Supervisor mode (state) ( 管 态 模式 )，215，221，343 
Symbol table (符号 表 )，63 
Symmetric multiprocessor (对 称 式 多 处 理 器 )，636 
Synchronous DRAM (SDRAM) ( 间 步 DRAM)，302 
Synchronous sequential circuit (同步 时 序 电路 )，718 
Synchronous transmission (同步 传输 )，568 
Syntax (语法 ) 
System Performance Evaluation Corporation (SPEC) 
(系统 性 能 评估 协会 )，18 
System software (系统 软件 )，10 
System space (系统 空间 )，343 
System-on-a-chip (片上 系统 )，546 


T 


Testability ( 可 测试 性 ) 546 

Test-and-Set instruction (测试 - 置 位 指令 )，640 

Text editor (文本 编辑 器 )，11 

TFT (Thin-film transistor) display ( 落 碟 晶体 管 显示 器 )， 
560 

Thread (线程 )，650 

Three-state ( =) 

Threshold (HA), 678. 684 
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Tightly-coupled multiprocessor (紧密 而 合 多 人 处理 器 )， 
645 
Time slicing (时 间 片 )，221 
Timers (定时 器 ) 524 
Timing signals (时 序 信 号 )，6 
Token-ring network ( 邻 牌 环 网 )，647 
Torus network ( 圆 环 形 网 络 )，630 
Touchpad (触摸 垫 )，557 
Trace exception 《跟踪 异常 )，220 
Trackball (跟踪 球 )，556 
Transition time (转换 时 间 )，686 
Transmission (传输 ) 
asynchronous (异步 )，566 
simplex and duplex ( 单 工 和 双 工 )，565 
synchronous (同步 )，568 
Trap (陷阱 )，220 
Tree network〈 树 状 网 络 ) 630 
Tri-state《〈 工 态 )，415，687 
Truth table《 真 值 表 ) ，662 
2’s-complement representation ( 补 码 表 示 )，27 
Two-wire link ( 双 线 连接 )，564 


U 


UART (Universal Asynchronous Receiver Transmitter) 
(通用 异步 收发 器 ) 259 
UltraSPARC II, 493, 595 


UMA multiprocessors (UMA 多 处 理 器 ) 622 
User mode (state) (用 户 模 式 /状态 )，215，221，343 


过 šl 
User space (用 户 空间 )，343 
V 
Very large-scale integration ( VLSI) {超大 规模 集成 )，9， 


20 
Video display (视频 显示 器 )，558 
Virtual address ( 虚 氛 地 址 )，294，338 
address translation (地 址 转换 )，339 
page (页 )，339 
page fault (页 故障 )，342 
page frame ( PiWi), 339 
page table (页 表 )，339 
translation buffer (TLB) (转换 缓冲 区 )，341 
virtual address (虚拟 地 址 )，294，338 
Von Neumann architecture (14 - 诺 依 曼 体 系 结构 )，19 


W ` 


Wait loop ( 等待 循环 )，66 

Wide area networks (WAN) (广域网)，646 
Winchester (UWE), 345 

Word (F), 5 

Word alignment ( 字 对 齐 )，36 

Word length ( 字 长 )，5，33 

Workstation (工作 站 )，2 

Wormhole routing ( 虫 孔 路 由 )，634 

Write buffer ( 写 缓冲 区 )，335 

Write-back protocol ( 写 回 协议 )，316 
Write-through protocol ( 直接 写 协 议 )，316，642 
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